LassoModel¶
-
類
pyspark.mllib.regression。
LassoModel
( 權重:pyspark.mllib.linalg.Vector,攔截:浮動 ) ¶ -
從最小二乘線性回歸模型推導出符合一個l1懲罰項。
例子
> > >從pyspark.mllib.linalg進口SparseVector> > >從pyspark.mllib.regression進口LabeledPoint> > >數據=(…LabeledPoint(0.0,(0.0]),…LabeledPoint(1.0,(1.0]),…LabeledPoint(3.0,(2.0]),…LabeledPoint(2.0,(3.0])…]> > >lrm=LassoWithSGD。火車(…sc。並行化(數據),迭代=10,initialWeights=np。數組([1.0)))> > >腹肌(lrm。預測(np。數組([0.0)))- - - - - -0)<0.5真正的> > >腹肌(lrm。預測(np。數組([1.0)))- - - - - -1)<0.5真正的> > >腹肌(lrm。預測(SparseVector(1,{0:1.0}))- - - - - -1)<0.5真正的> > >腹肌(lrm。預測(sc。並行化([[1.0]]))。收集()(0]- - - - - -1)<0.5真正的> > >進口操作係統,tempfile> > >路徑=tempfile。mkdtemp()> > >lrm。保存(sc,路徑)> > >sameModel=LassoModel。負載(sc,路徑)> > >腹肌(sameModel。預測(np。數組([0.0)))- - - - - -0)<0.5真正的> > >腹肌(sameModel。預測(np。數組([1.0)))- - - - - -1)<0.5真正的> > >腹肌(sameModel。預測(SparseVector(1,{0:1.0}))- - - - - -1)<0.5真正的> > >從shutil進口rmtree> > >試一試:…rmtree(路徑)…除了BaseException:…通過> > >數據=(…LabeledPoint(0.0,SparseVector(1,{0:0.0})),…LabeledPoint(1.0,SparseVector(1,{0:1.0})),…LabeledPoint(3.0,SparseVector(1,{0:2.0})),…LabeledPoint(2.0,SparseVector(1,{0:3.0}))…]> > >lrm=LinearRegressionWithSGD。火車(sc。並行化(數據),迭代=10,…initialWeights=np。數組([1.0)))> > >腹肌(lrm。預測(np。數組([0.0)))- - - - - -0)<0.5真正的> > >腹肌(lrm。預測(SparseVector(1,{0:1.0}))- - - - - -1)<0.5真正的> > >lrm=LassoWithSGD。火車(sc。並行化(數據),迭代=10,一步=1.0,…regParam=0.01,miniBatchFraction=1.0,initialWeights=np。數組([1.0]),攔截=真正的,…validateData=真正的)> > >腹肌(lrm。預測(np。數組([0.0)))- - - - - -0)<0.5真正的> > >腹肌(lrm。預測(SparseVector(1,{0:1.0}))- - - - - -1)<0.5真正的
方法
負載
(sc路徑)加載LassoModel。
預測
(x)預測因變量的值給定的向量或一個向量的抽樣,其中包含獨立變量的值。
保存
(sc路徑)節省LassoModel。
屬性
截距計算模型。
權重計算為每個特性。
方法的文檔
-
classmethod
負載
( sc:pyspark.context.SparkContext,路徑:str )→pyspark.mllib.regression.LassoModel ¶ -
加載LassoModel。
-
預測
( x:聯盟(VectorLike,pyspark.rdd.RDD(VectorLike]] )→聯盟(浮動,pyspark.rdd.RDD(浮動] ] ¶ -
預測因變量的值給定的向量或一個向量的抽樣,其中包含獨立變量的值。
-
保存
( sc:pyspark.context.SparkContext,路徑:str )→沒有¶ -
節省LassoModel。
屬性的文檔
-
攔截
¶ -
截距計算模型。
-
權重
¶ -
權重計算為每個特性。
-
classmethod