SVMModel

pyspark.mllib.classification。 SVMModel ( 權重:pyspark.mllib.linalg.Vector,攔截:浮動 )

支持向量機模型(svm)。

參數
權重 pyspark.mllib.linalg.Vector

權重計算為每個特性。

攔截 浮動

截距計算模型。

例子

> > >pyspark.mllib.linalg進口SparseVector> > >數據=(LabeledPoint(0.0,(0.0]),LabeledPoint(1.0,(1.0]),LabeledPoint(1.0,(2.0]),LabeledPoint(1.0,(3.0])]> > >支持向量機=SVMWithSGD火車(sc並行化(數據),迭代=10)> > >支持向量機預測([1.0])1> > >支持向量機預測(sc並行化([[1.0]]))收集()[1]> > >支持向量機clearThreshold()> > >支持向量機預測(numpy數組([1.0)))1.44……
> > >sparse_data=(LabeledPoint(0.0,SparseVector(2,{0:- - - - - -1.0})),LabeledPoint(1.0,SparseVector(2,{1:1.0})),LabeledPoint(0.0,SparseVector(2,{0:0.0})),LabeledPoint(1.0,SparseVector(2,{1:2.0}))]> > >支持向量機=SVMWithSGD火車(sc並行化(sparse_data),迭代=10)> > >支持向量機預測(SparseVector(2,{1:1.0}))1> > >支持向量機預測(SparseVector(2,{0:- - - - - -1.0}))0> > >進口操作係統,tempfile> > >路徑=tempfilemkdtemp()> > >支持向量機保存(sc,路徑)> > >sameModel=SVMModel負載(sc,路徑)> > >sameModel預測(SparseVector(2,{1:1.0}))1> > >sameModel預測(SparseVector(2,{0:- - - - - -1.0}))0> > >shutil進口rmtree> > >試一試:rmtree(路徑)除了BaseException:通過

方法

clearThreshold()

掃清了閾值,這樣預測將輸出的原始預測分數。

負載(sc路徑)

從給定的路徑加載模型。

預測(x)

預測單個數據點的值或一個抽樣點的使用模型訓練。

保存(sc路徑)

這個模型保存到給定的路徑。

setThreshold(值)

設置閾值之間積極的預測從消極的預測。

屬性

攔截

截距計算模型。

閾值

返回閾值(如果有的話)用於預測預測分數轉化為0/1。

權重

權重計算為每個特性。

方法的文檔

clearThreshold ( )→沒有

掃清了閾值,這樣預測將輸出的原始預測分數。這是僅用於二進製分類。

classmethod 負載 ( sc:pyspark.context.SparkContext,路徑:str )pyspark.mllib.classification.SVMModel

從給定的路徑加載模型。

預測 ( x:聯盟(VectorLike,pyspark.rdd.RDD(VectorLike]] )→聯盟(pyspark.rdd.RDD(聯盟(int,浮動] ] ,int,浮動]

預測單個數據點的值或一個抽樣點的使用模型訓練。

保存 ( sc:pyspark.context.SparkContext,路徑:str )→沒有

這個模型保存到給定的路徑。

setThreshold ( 價值:浮動 )→沒有

設置閾值之間積極的預測從消極的預測。一個例子與預測得分大於或等於閾值被認為是積極和消極的。這是僅用於二進製分類。

屬性的文檔

攔截

截距計算模型。

閾值

返回閾值(如果有的話)用於預測預測分數轉化為0/1。這是僅用於二進製分類。

權重

權重計算為每個特性。