NaiveBayes

pyspark.mllib.classification。 NaiveBayes

火車多項樸素貝葉斯模型。

方法

火車(數據(,lambda_))

火車一個樸素貝葉斯模型給出一個抽樣(標簽,功能)的向量。

方法的文檔

classmethod 火車 ( 數據:pyspark.rdd.RDD(pyspark.mllib.regression.LabeledPoint],lambda_:浮動=1.0 )pyspark.mllib.classification.NaiveBayesModel

火車一個樸素貝葉斯模型給出一個抽樣(標簽,功能)的向量。

這是多項NB它可以處理各種各樣的離散數據。例如,通過將文檔轉換成TF-IDF向量,它可用於文檔分類。通過每一個向量0 - 1的向量,它也可以被用作伯努利NB。輸入特征值必須是負的。

參數
數據 pyspark.RDD

訓練數據的抽樣pyspark.mllib.regression.LabeledPoint

lambda_ 浮動,可選

平滑參數。(默認值:1.0)