向量

pyspark.mllib.linalg。 向量

工廠方法來處理向量。

筆記

密集的向量是簡單地表示為NumPy數組對象,所以不需要秘密MLlib使用。對於稀疏向量,在這個類創建一個工廠方法MLlib-compatible類型,或者用戶可以通過SciPyscipy.sparse列向量。

方法

密集的(*元素)

創建一個密集的64位浮點數向量Python列表或數字。

fromML(vec)

從新mllib-local轉換一個向量表示。

規範(向量,p)

找到規範給定的向量。

解析(年代)

解析字符串表示回向量。

稀疏的(大小、* args)

創建一個稀疏的向量,使用字典,(指數、價值)對的列表,或兩個獨立的指標和數組值(按指數排序)。

squared_distance(v1、v2)

方兩個向量之間的距離。

stringify(向量)

將一個向量轉換成一個字符串,可以被Vectors.parse ()。

0(大小)

方法的文檔

靜態 密集的 ( *元素:聯盟(浮動,字節,numpy.ndarray,Iterable(浮動]] )pyspark.mllib.linalg.DenseVector

創建一個密集的64位浮點數向量Python列表或數字。

例子

> > >向量密集的([1,2,3])DenseVector ((1.0, 2.0, 3.0))> > >向量密集的(1.0,2.0)DenseVector ([1.0, 2.0])
靜態 fromML ( vec:pyspark.ml.linalg.DenseVector )pyspark.mllib.linalg.DenseVector

從新mllib-local轉換一個向量表示。這並不複製數據;它複製引用。

參數
vec pyspark.ml.linalg.Vector
返回
pyspark.mllib.linalg.Vector
靜態 規範 ( 向量:pyspark.mllib.linalg.Vector,p:NormType )→numpy.float64

找到規範給定的向量。

靜態 解析 ( 年代:str )pyspark.mllib.linalg.Vector

解析字符串表示回向量。

例子

> > >向量解析((2,1,2)的)DenseVector ((2.0, 1.0, 2.0))> > >向量解析(”(100年,[0],[2])”)SparseVector(100年,{0:2.0})
靜態 稀疏的 ( 大小:int,*arg遊戲:聯盟(字節,元組(int,浮動],Iterable(浮動],Iterable(元組(int,浮動]],Dict(int,浮動]] )pyspark.mllib.linalg.SparseVector

創建一個稀疏的向量,使用字典,(指數、價值)對的列表,或兩個獨立的指標和數組值(按指數排序)。

參數
大小 int

向量的大小。

arg遊戲

非零元素,作為一個字典,元組的列表,或兩個排序的列表包含指數和價值觀。

例子

> > >向量稀疏的(4,{1:1.0,3:5.5})SparseVector (4, {1: 1.0, 3: 5.5})> > >向量稀疏的(4,((1,1.0),(3,5.5)))SparseVector (4, {1: 1.0, 3: 5.5})> > >向量稀疏的(4,(1,3),(1.0,5.5])SparseVector (4, {1: 1.0, 3: 5.5})
靜態 squared_distance ( v1:pyspark.mllib.linalg.Vector,v2:pyspark.mllib.linalg.Vector )→numpy.float64

方兩個向量之間的距離。a和b可以SparseVector類型,DenseVector, np。ndarray或array.array。

例子

> > >一個=向量稀疏的(4,((0,1),(3,4)))> > >b=向量密集的([2,5,4,1])> > >一個squared_distance(b)51.0
靜態 stringify ( 向量:pyspark.mllib.linalg.Vector )→str

將一個向量轉換成一個字符串,可以被Vectors.parse ()。

例子

> > >向量stringify(向量稀疏的(2,(1),(1.0)))(2)[1],[1.0])”> > >向量stringify(向量密集的([0.0,1.0)))“[0.0,1.0]”
靜態 0 ( 大小:int )pyspark.mllib.linalg.DenseVector