SparseVector

pyspark.mllib.linalg。 SparseVector ( 大小:int,*arg遊戲:聯盟(字節,元組(int,浮動],Iterable(浮動],Iterable(元組(int,浮動]],Dict(int,浮動]] )

一個簡單的稀疏向量類MLlib傳遞數據。用戶可能會選擇通過SciPy {SciPy。稀疏}數據類型。

方法

asML()

這個向量轉換為新的mllib-local表示。

(其他)

點積SparseVector或1 -或二維Numpy數組。

規範(p)

計算SparseVector的規範。

numNonzeros()

非零元素的數量。

解析(年代)

解析字符串表示回SparseVector。

squared_distance(其他)

的平方距離SparseVector或維NumPy數組。

toArray()

返回一個副本SparseVector作為維NumPy數組。

方法的文檔

asML ( )pyspark.ml.linalg.SparseVector

這個向量轉換為新的mllib-local表示。這並不複製數據;它複製引用。

返回
pyspark.ml.linalg.SparseVector
( 其他:Iterable(浮動] )→numpy.float64

點積SparseVector或1 -或二維Numpy數組。

例子

> > >一個=SparseVector(4,(1,3),(3.0,4.0])> > >一個(一個)25.0> > >一個(數組數組(' d ',(1。,2。,3所示。,4所示。)))22.0> > >b=SparseVector(4,(2),(1.0])> > >一個(b)0.0> > >一個(np數組([[1,1),(2,2),(3,3),(4,4]]))數組([22。,22。)> > >一個([1。,2。,3所示。])回溯(最近的電話):AssertionError:尺寸不匹配> > >一個(np數組([1。,2。)))回溯(最近的電話):AssertionError:尺寸不匹配> > >一個(DenseVector([1。,2。)))回溯(最近的電話):AssertionError:尺寸不匹配> > >一個(np0((3,2)))回溯(最近的電話):AssertionError:尺寸不匹配
規範 ( p:NormType )→numpy.float64

計算SparseVector的規範。

例子

> > >一個=SparseVector(4,(0,1),(3所示。,- - - - - -4所示。])> > >一個規範(1)7.0> > >一個規範(2)5.0
numNonzeros ( )→int

非零元素的數量。這個掃描所有活躍的非零值和計數。

靜態 解析 ( 年代:str )pyspark.mllib.linalg.SparseVector

解析字符串表示回SparseVector。

例子

> > >SparseVector解析(”(4 [0,1][4.0,5.0])”)SparseVector ({0: 4.0, 1: 5.0})
squared_distance ( 其他:Iterable(浮動] )→numpy.float64

的平方距離SparseVector或維NumPy數組。

例子

> > >一個=SparseVector(4,(1,3),(3.0,4.0])> > >一個squared_distance(一個)0.0> > >一個squared_distance(數組數組(' d ',(1。,2。,3所示。,4所示。)))11.0> > >一個squared_distance(np數組([1。,2。,3所示。,4所示。)))11.0> > >b=SparseVector(4,(2),(1.0])> > >一個squared_distance(b)26.0> > >bsquared_distance(一個)26.0> > >bsquared_distance([1。,2。])回溯(最近的電話):AssertionError:尺寸不匹配> > >bsquared_distance(SparseVector(3,(1),(1.0,)))回溯(最近的電話):AssertionError:尺寸不匹配
toArray ( )→numpy.ndarray

返回一個副本SparseVector作為維NumPy數組。