IsotonicRegressionModel

pyspark.mllib.regression。 IsotonicRegressionModel ( 邊界:numpy.ndarray,預測:numpy.ndarray,等張:bool )

回歸模型的等張回歸。

參數
邊界 ndarray

數組的邊界預測是已知的。邊界必須進行排序在增加訂單。

預測 ndarray

數組的邊界在同一指數相關預測。保序回歸的結果,因此單調。

等張 真正的

表明這是等滲或反序。

例子

> > >數據=((1,0,1),(2,1,1),(3,2,1),(1,3,1),(6,4,1),(17,5,1),(16,6,1)]> > >irm=IsotonicRegression火車(sc並行化(數據))> > >irm預測(3)2.0> > >irm預測(5)16.5> > >irm預測(sc並行化([3,5)))收集()[2.0,16.5]> > >進口操作係統,tempfile> > >路徑=tempfilemkdtemp()> > >irm保存(sc,路徑)> > >sameModel=IsotonicRegressionModel負載(sc,路徑)> > >sameModel預測(3)2.0> > >sameModel預測(5)16.5> > >shutil進口rmtree> > >試一試:rmtree(路徑)除了OSError:通過

方法

負載(sc路徑)

加載一個IsotonicRegressionModel。

預測(x)

預測提供特性的標簽。

保存(sc路徑)

保存一個IsotonicRegressionModel。

方法的文檔

classmethod 負載 ( sc:pyspark.context.SparkContext,路徑:str )pyspark.mllib.regression.IsotonicRegressionModel

加載一個IsotonicRegressionModel。

預測 ( x:聯盟(浮動,VectorLike,pyspark.rdd.RDD(浮動],pyspark.rdd.RDD(VectorLike]] )→聯盟(numpy.float64,numpy.ndarray,pyspark.rdd.RDD(numpy.float64] ,pyspark.rdd.RDD(numpy.ndarray] ]

預測提供特性的標簽。使用分段線性函數。1)如果x完全匹配邊界然後返回相關的預測。如果有多個相同的預測邊界然後返回其中一個。哪一個是未定義(java.util.Arrays.binarySearch一樣)。2)如果x是低或高於所有邊界分別返回然後姓或預測。如果有多個相同的預測邊界分別返回然後最低或最高。3)如果x介於兩個值在數組邊界預測作為分段線性函數和插值返回值。如果有多個值具有相同的邊界使用同樣的規則2)。

參數
x pyspark.mllib.linalg.Vectorpyspark.RDD

特性或抽樣的功能標記。

保存 ( sc:pyspark.context.SparkContext,路徑:str )→沒有

保存一個IsotonicRegressionModel。