StreamingLogisticRegressionWithSGD¶
-
類
pyspark.mllib.classification。
StreamingLogisticRegressionWithSGD
( stepSize:浮動=0.1,numIterations:int=50,miniBatchFraction:浮動=1.0,regParam:浮動=0.0,convergenceTol:浮動=0.001 ) ¶ -
火車或預測流數據的邏輯回歸模型。培訓使用隨機梯度下降法來更新模型基於每個新批DStream傳入的數據。
每一批的數據被認為是一個LabeledPoints抽樣。數據點的數量每批可以不同,但功能的數量必須是常數。必須提供一個初始權向量。
- 參數
-
- stepSize 浮動,可選
-
為每個迭代步長梯度下降法。(默認值:0.1)
- numIterations int,可選
-
運行的迭代次數為每一批數據。(默認值:50)
- miniBatchFraction 浮動,可選
-
分數每一批的數據用於更新。(默認值:1.0)
- regParam 浮動,可選
-
L2正則化參數。(默認值:0.0)
- convergenceTol 浮動,可選
-
值用來確定何時終止迭代。(默認值:0.001)
方法
返回最新的模型。
predictOn
(dstream)使用該模型來預測從DStream批次的數據。
predictOnValues
(dstream)利用該模型預測的值DStream和攜帶的鑰匙。
setInitialWeights
(initialWeights)設置權重的初始值。
trainOn
(dstream)在傳入dstream火車模型。
方法的文檔
-
latestModel
( )→可選( pyspark.mllib.regression.LinearModel ] ¶ -
返回最新的模型。
-
predictOn
( dstream:DStream(VectorLike] )→DStream(浮動] ¶ -
使用該模型來預測從DStream批次的數據。
- 返回
-
-
pyspark.streaming.DStream
-
DStream包含預測。
-
-
predictOnValues
( dstream:DStream(元組(K,VectorLike]] )→DStream(元組(K,浮動] ] ¶ -
利用該模型預測的值DStream和攜帶的鑰匙。
- 返回
-
-
pyspark.streaming.DStream
-
DStream包含預測。
-
-
setInitialWeights
( initialWeights:VectorLike )→StreamingLogisticRegressionWithSGD¶ -
設置權重的初始值。
這個運行trainOn和predictOn之前必須設置。
-
trainOn
( dstream:pyspark.streaming.dstream.DStream(pyspark.mllib.regression.LabeledPoint] )→沒有¶ -
在傳入dstream火車模型。