RidgeRegressionWithSGD¶
-
類
pyspark.mllib.regression。
RidgeRegressionWithSGD
¶ -
火車L2-regularization使用隨機梯度下降法的回歸模型。
使用
pyspark.ml.regression.LinearRegression
elasticNetParam = 0.0。注意默認regParam RidgeRegressionWithSGD是0.01,但是0.0 LinearRegression。方法
火車
(數據、迭代步驟,regParam…))火車L2-regularization使用隨機梯度下降法的回歸模型。
方法的文檔
-
classmethod
火車
( 數據:pyspark.rdd.RDD(pyspark.mllib.regression.LabeledPoint],迭代:int=One hundred.,一步:浮動=1.0,regParam:浮動=0.01,miniBatchFraction:浮動=1.0,initialWeights:可選(VectorLike]=沒有一個,攔截:bool=假,validateData:bool=真正的,convergenceTol:浮動=0.001 )→pyspark.mllib.regression.RidgeRegressionModel ¶ -
火車L2-regularization使用隨機梯度下降法的回歸模型。這解決了l2-regularized最小二乘回歸公式
f(權重)= 1 / (2 n) | |一個權重- y | | ^ 2 + regParam / 2 | |權重| | ^ 2
這裏的數據矩陣n行,輸入抽樣的行集,每個都有其相應的右手邊標簽y。參見文檔的精確公式。
- 參數
-
-
數據
pyspark.RDD
-
訓練數據,LabeledPoint的抽樣。
- 迭代 int,可選
-
迭代的數量。(默認:100)
- 一步 浮動,可選
-
步驟參數用於SGD。(默認值:1.0)
- regParam 浮動,可選
-
調整參數。(默認值:0.01)
- miniBatchFraction 浮動,可選
-
部分數據被用於每個SGD迭代。(默認值:1.0)
-
initialWeights
pyspark.mllib.linalg.Vector
或可兌換,可選 -
最初的重量。(默認值:無)
- 攔截 bool,可選
-
布爾參數表示使用或不增強表達的訓練數據(即是否偏差特性被激活)。(默認值:False)
- validateData bool,可選
-
布爾參數,表明該算法是否應該訓練之前驗證數據。(默認值是真實的)
- convergenceTol 浮動,可選
-
一個決定迭代終止條件。(默認值:0.001)
-
數據
-
classmethod