SVMWithSGD

pyspark.mllib.classification。 SVMWithSGD

訓練支持向量機(SVM)使用隨機梯度下降法。

方法

火車(數據、迭代步驟,regParam…))

對給定的數據訓練支持向量機。

方法的文檔

classmethod 火車 ( 數據:pyspark.rdd.RDD(pyspark.mllib.regression.LabeledPoint],迭代:int=One hundred.,一步:浮動=1.0,regParam:浮動=0.01,miniBatchFraction:浮動=1.0,initialWeights:可選(VectorLike]=沒有一個,regType:str=“外語”,攔截:bool=,validateData:bool=真正的,convergenceTol:浮動=0.001 )pyspark.mllib.classification.SVMModel

對給定的數據訓練支持向量機。

參數
數據 pyspark.RDD

訓練數據的抽樣pyspark.mllib.regression.LabeledPoint

迭代 int,可選

迭代的數量。(默認:100)

一步 浮動,可選

步驟參數用於SGD。(默認值:1.0)

regParam 浮動,可選

調整參數。(默認值:0.01)

miniBatchFraction 浮動,可選

部分數據被用於每個SGD迭代。(默認值:1.0)

initialWeights pyspark.mllib.linalg.Vector或可兌換,可選

最初的重量。(默認值:無)

regType str,可選

規範用於訓練模型的類型。允許的值:

  • “l1”使用l1正規化

  • “l2”使用l2正規化(默認)

  • 沒有沒有正規化

攔截 bool,可選

布爾參數表示使用或不增強表達的訓練數據(即是否偏差特性被激活)。(默認值:False)

validateData bool,可選

布爾參數,表明該算法是否應該訓練之前驗證數據。(默認值是真實的)

convergenceTol 浮動,可選

一個決定迭代終止條件。(默認值:0.001)