NaiveBayesModel¶
-
類
pyspark.mllib.classification。
NaiveBayesModel
( 標簽:numpy.ndarray,π:numpy.ndarray,θ:numpy.ndarray ) ¶ -
樸素貝葉斯分類器的模型。
- 參數
-
-
標簽
numpy.ndarray
-
標簽的列表。
-
π
numpy.ndarray
-
日誌類的先驗的維C,數量的標簽。
-
θ
numpy.ndarray
-
日誌的類條件概率,其維度C-by-D, D是數量的特性。
-
標簽
例子
> > >從pyspark.mllib.linalg進口SparseVector> > >數據=(…LabeledPoint(0.0,(0.0,0.0]),…LabeledPoint(0.0,(0.0,1.0]),…LabeledPoint(1.0,(1.0,0.0]),…]> > >模型=NaiveBayes。火車(sc。並行化(數據))> > >模型。預測(numpy。數組([0.0,1.0)))0.0> > >模型。預測(numpy。數組([1.0,0.0)))1.0> > >模型。預測(sc。並行化([[1.0,0.0]]))。收集()[1.0]> > >sparse_data=(…LabeledPoint(0.0,SparseVector(2,{1:0.0})),…LabeledPoint(0.0,SparseVector(2,{1:1.0})),…LabeledPoint(1.0,SparseVector(2,{0:1.0}))…]> > >模型=NaiveBayes。火車(sc。並行化(sparse_data))> > >模型。預測(SparseVector(2,{1:1.0}))0.0> > >模型。預測(SparseVector(2,{0:1.0}))1.0> > >進口操作係統,tempfile> > >路徑=tempfile。mkdtemp()> > >模型。保存(sc,路徑)> > >sameModel=NaiveBayesModel。負載(sc,路徑)> > >sameModel。預測(SparseVector(2,{0:1.0}))= =模型。預測(SparseVector(2,{0:1.0}))真正的> > >從shutil進口rmtree> > >試一試:…rmtree(路徑)…除了OSError:…通過
方法
負載
(sc路徑)從給定的路徑加載模型。
預測
(x)返回最可能的類數據向量的向量或一個抽樣
保存
(sc路徑)這個模型保存到給定的路徑。
方法的文檔
-
classmethod
負載
( sc:pyspark.context.SparkContext,路徑:str )→pyspark.mllib.classification.NaiveBayesModel ¶ -
從給定的路徑加載模型。
-
預測
( x:聯盟(VectorLike,pyspark.rdd.RDD(VectorLike]] )→聯盟(numpy.float64,pyspark.rdd.RDD(numpy.float64] ] ¶ -
返回最可能的類數據向量的向量或一個抽樣
-
保存
( sc:pyspark.context.SparkContext,路徑:str )→沒有¶ -
這個模型保存到給定的路徑。