NaiveBayesModel

pyspark.mllib.classification。 NaiveBayesModel ( 標簽:numpy.ndarray,π:numpy.ndarray,θ:numpy.ndarray )

樸素貝葉斯分類器的模型。

參數
標簽 numpy.ndarray

標簽的列表。

π numpy.ndarray

日誌類的先驗的維C,數量的標簽。

θ numpy.ndarray

日誌的類條件概率,其維度C-by-D, D是數量的特性。

例子

> > >pyspark.mllib.linalg進口SparseVector> > >數據=(LabeledPoint(0.0,(0.0,0.0]),LabeledPoint(0.0,(0.0,1.0]),LabeledPoint(1.0,(1.0,0.0]),]> > >模型=NaiveBayes火車(sc並行化(數據))> > >模型預測(numpy數組([0.0,1.0)))0.0> > >模型預測(numpy數組([1.0,0.0)))1.0> > >模型預測(sc並行化([[1.0,0.0]]))收集()[1.0]> > >sparse_data=(LabeledPoint(0.0,SparseVector(2,{1:0.0})),LabeledPoint(0.0,SparseVector(2,{1:1.0})),LabeledPoint(1.0,SparseVector(2,{0:1.0}))]> > >模型=NaiveBayes火車(sc並行化(sparse_data))> > >模型預測(SparseVector(2,{1:1.0}))0.0> > >模型預測(SparseVector(2,{0:1.0}))1.0> > >進口操作係統,tempfile> > >路徑=tempfilemkdtemp()> > >模型保存(sc,路徑)> > >sameModel=NaiveBayesModel負載(sc,路徑)> > >sameModel預測(SparseVector(2,{0:1.0}))= =模型預測(SparseVector(2,{0:1.0}))真正的> > >shutil進口rmtree> > >試一試:rmtree(路徑)除了OSError:通過

方法

負載(sc路徑)

從給定的路徑加載模型。

預測(x)

返回最可能的類數據向量的向量或一個抽樣

保存(sc路徑)

這個模型保存到給定的路徑。

方法的文檔

classmethod 負載 ( sc:pyspark.context.SparkContext,路徑:str )pyspark.mllib.classification.NaiveBayesModel

從給定的路徑加載模型。

預測 ( x:聯盟(VectorLike,pyspark.rdd.RDD(VectorLike]] )→聯盟(numpy.float64,pyspark.rdd.RDD(numpy.float64] ]

返回最可能的類數據向量的向量或一個抽樣

保存 ( sc:pyspark.context.SparkContext,路徑:str )→沒有

這個模型保存到給定的路徑。