NaiveBayesModel¶

類 pyspark.mllib.classification。 NaiveBayesModel ( 標簽:numpy.ndarray,π:numpy.ndarray,θ:numpy.ndarray ) ¶

樸素貝葉斯分類器的模型。

參數

標簽 numpy.ndarray: 標簽的列表。
π numpy.ndarray: 日誌類的先驗的維C,數量的標簽。
θ numpy.ndarray: 日誌的類條件概率,其維度C-by-D, D是數量的特性。

例子

           > > >從pyspark.mllib.linalg進口SparseVector> > >數據=(…LabeledPoint(0.0,(0.0,0.0]),…LabeledPoint(0.0,(0.0,1.0]),…LabeledPoint(1.0,(1.0,0.0]),…]> > >模型=NaiveBayes。火車(sc。並行化(數據))> > >模型。預測(numpy。數組([0.0,1.0)))0.0> > >模型。預測(numpy。數組([1.0,0.0)))1.0> > >模型。預測(sc。並行化([[1.0,0.0]]))。收集()[1.0]> > >sparse_data=(…LabeledPoint(0.0,SparseVector(2,{1:0.0})),…LabeledPoint(0.0,SparseVector(2,{1:1.0})),…LabeledPoint(1.0,SparseVector(2,{0:1.0}))…]> > >模型=NaiveBayes。火車(sc。並行化(sparse_data))> > >模型。預測(SparseVector(2,{1:1.0}))0.0> > >模型。預測(SparseVector(2,{0:1.0}))1.0> > >進口操作係統,tempfile> > >路徑=tempfile。mkdtemp()> > >模型。保存(sc,路徑)> > >sameModel=NaiveBayesModel。負載(sc,路徑)> > >sameModel。預測(SparseVector(2,{0:1.0}))= =模型。預測(SparseVector(2,{0:1.0}))真正的> > >從shutil進口rmtree> > >試一試:…rmtree(路徑)…除了OSError:…通過
          

方法

`負載`(sc路徑)	從給定的路徑加載模型。
`預測`(x)	返回最可能的類數據向量的向量或一個抽樣
`保存`(sc路徑)	這個模型保存到給定的路徑。

方法的文檔

classmethod 負載 ( sc:pyspark.context.SparkContext,路徑:str )→pyspark.mllib.classification.NaiveBayesModel ¶: 從給定的路徑加載模型。

預測 ( x:聯盟(VectorLike,pyspark.rdd.RDD(VectorLike]] )→聯盟(numpy.float64,pyspark.rdd.RDD(numpy.float64] ] ¶: 返回最可能的類數據向量的向量或一個抽樣

保存 ( sc:pyspark.context.SparkContext,路徑:str )→沒有¶: 這個模型保存到給定的路徑。

以前的

SVMWithSGD

下一個

NaiveBayes