LassoModel

pyspark.mllib.regression。 LassoModel ( 權重:pyspark.mllib.linalg.Vector,攔截:浮動 )

從最小二乘線性回歸模型推導出符合一個l1懲罰項。

例子

> > >pyspark.mllib.linalg進口SparseVector> > >pyspark.mllib.regression進口LabeledPoint> > >數據=(LabeledPoint(0.0,(0.0]),LabeledPoint(1.0,(1.0]),LabeledPoint(3.0,(2.0]),LabeledPoint(2.0,(3.0])]> > >lrm=LassoWithSGD火車(sc並行化(數據),迭代=10,initialWeights=np數組([1.0)))> > >腹肌(lrm預測(np數組([0.0)))- - - - - -0)<0.5真正的> > >腹肌(lrm預測(np數組([1.0)))- - - - - -1)<0.5真正的> > >腹肌(lrm預測(SparseVector(1,{0:1.0}))- - - - - -1)<0.5真正的> > >腹肌(lrm預測(sc並行化([[1.0]]))收集()(0]- - - - - -1)<0.5真正的> > >進口操作係統,tempfile> > >路徑=tempfilemkdtemp()> > >lrm保存(sc,路徑)> > >sameModel=LassoModel負載(sc,路徑)> > >腹肌(sameModel預測(np數組([0.0)))- - - - - -0)<0.5真正的> > >腹肌(sameModel預測(np數組([1.0)))- - - - - -1)<0.5真正的> > >腹肌(sameModel預測(SparseVector(1,{0:1.0}))- - - - - -1)<0.5真正的> > >shutil進口rmtree> > >試一試:rmtree(路徑)除了BaseException:通過> > >數據=(LabeledPoint(0.0,SparseVector(1,{0:0.0})),LabeledPoint(1.0,SparseVector(1,{0:1.0})),LabeledPoint(3.0,SparseVector(1,{0:2.0})),LabeledPoint(2.0,SparseVector(1,{0:3.0}))]> > >lrm=LinearRegressionWithSGD火車(sc並行化(數據),迭代=10,initialWeights=np數組([1.0)))> > >腹肌(lrm預測(np數組([0.0)))- - - - - -0)<0.5真正的> > >腹肌(lrm預測(SparseVector(1,{0:1.0}))- - - - - -1)<0.5真正的> > >lrm=LassoWithSGD火車(sc並行化(數據),迭代=10,一步=1.0,regParam=0.01,miniBatchFraction=1.0,initialWeights=np數組([1.0]),攔截=真正的,validateData=真正的)> > >腹肌(lrm預測(np數組([0.0)))- - - - - -0)<0.5真正的> > >腹肌(lrm預測(SparseVector(1,{0:1.0}))- - - - - -1)<0.5真正的

方法

負載(sc路徑)

加載LassoModel。

預測(x)

預測因變量的值給定的向量或一個向量的抽樣,其中包含獨立變量的值。

保存(sc路徑)

節省LassoModel。

屬性

攔截

截距計算模型。

權重

權重計算為每個特性。

方法的文檔

classmethod 負載 ( sc:pyspark.context.SparkContext,路徑:str )pyspark.mllib.regression.LassoModel

加載LassoModel。

預測 ( x:聯盟(VectorLike,pyspark.rdd.RDD(VectorLike]] )→聯盟(浮動,pyspark.rdd.RDD(浮動] ]

預測因變量的值給定的向量或一個向量的抽樣,其中包含獨立變量的值。

保存 ( sc:pyspark.context.SparkContext,路徑:str )→沒有

節省LassoModel。

屬性的文檔

攔截

截距計算模型。

權重

權重計算為每個特性。