NaiveBayes¶
-
類
pyspark.mllib.classification。
NaiveBayes
¶ -
火車多項樸素貝葉斯模型。
方法
火車
(數據(,lambda_))火車一個樸素貝葉斯模型給出一個抽樣(標簽,功能)的向量。
方法的文檔
-
classmethod
火車
( 數據:pyspark.rdd.RDD(pyspark.mllib.regression.LabeledPoint],lambda_:浮動=1.0 )→pyspark.mllib.classification.NaiveBayesModel ¶ -
火車一個樸素貝葉斯模型給出一個抽樣(標簽,功能)的向量。
這是多項NB它可以處理各種各樣的離散數據。例如,通過將文檔轉換成TF-IDF向量,它可用於文檔分類。通過每一個向量0 - 1的向量,它也可以被用作伯努利NB。輸入特征值必須是負的。
- 參數
-
-
數據
pyspark.RDD
- lambda_ 浮動,可選
-
平滑參數。(默認值:1.0)
-
數據
-
classmethod