標準化者

pyspark.mllib.feature。 標準化者 ( p:浮動=2.0 )

可實現樣品單獨單元Lp規範

1 < =p<浮動(正),實現樣本規範化使用和(abs(向量)p)(1 / p)為規範。

p=浮動(正)、馬克斯(abs(向量))將作為標準化的規範。

參數
p 浮動,可選

標準化在p L ^ ^空間,默認p = 2。

例子

> > >pyspark.mllib.linalg進口向量> > >v=向量密集的(範圍(3))> > >也不=標準化者(1)> > >也不變換(v)DenseVector ((0.0, 0.3333, 0.6667))
> > >抽樣=sc並行化([v])> > >也不變換(抽樣)收集()[DenseVector ((0.0, 0.3333, 0.6667)))
> > >nor2=標準化者(浮動(“正”))> > >nor2變換(v)DenseVector ((0.0, 0.5, 1.0))

方法

變換(向量)

適用於單位長度歸一化向量。

方法的文檔

變換 ( 向量:聯盟(VectorLike,pyspark.rdd.RDD(VectorLike]] )→聯盟( pyspark.mllib.linalg.Vector ,pyspark.rdd.RDD( pyspark.mllib.linalg.Vector ] ]

適用於單位長度歸一化向量。

參數
向量 pyspark.mllib.linalg.Vectorpyspark.RDD

向量或抽樣向量歸一化。

返回
pyspark.mllib.linalg.Vectorpyspark.RDD

歸一化向量(s)。如果輸入的標準是零,它將返回輸入向量。