向量¶
-
類
pyspark.ml.linalg。
向量
¶ -
工廠方法來處理向量。
筆記
密集的向量是簡單地表示為NumPy數組對象,所以不需要秘密MLlib使用。對於稀疏向量,在這個類創建一個工廠方法MLlib-compatible類型,或者用戶可以通過SciPyscipy.sparse列向量。
方法
密集的
(*元素)創建一個密集的64位浮點數向量Python列表或數字。
規範
(向量,p)找到規範給定的向量。
稀疏的
(大小、* args)創建一個稀疏的向量,使用字典,(指數、價值)對的列表,或兩個獨立的指標和數組值(按指數排序)。
squared_distance
(v1、v2)方兩個向量之間的距離。
0
(大小)方法的文檔
-
靜態
密集的
( *元素:聯盟(浮動,字節,numpy.ndarray,Iterable(浮動]] )→pyspark.ml.linalg.DenseVector ¶ -
創建一個密集的64位浮點數向量Python列表或數字。
例子
> > >向量。密集的([1,2,3])DenseVector ((1.0, 2.0, 3.0))> > >向量。密集的(1.0,2.0)DenseVector ([1.0, 2.0])
-
靜態
規範
( 向量:pyspark.ml.linalg.Vector,p:NormType )→numpy.float64¶ -
找到規範給定的向量。
-
靜態
稀疏的
( 大小:int,*arg遊戲:聯盟(字節,元組(int,浮動],Iterable(浮動],Iterable(元組(int,浮動]],Dict(int,浮動]] )→pyspark.ml.linalg.SparseVector ¶ -
創建一個稀疏的向量,使用字典,(指數、價值)對的列表,或兩個獨立的指標和數組值(按指數排序)。
- 參數
-
- 大小 int
-
向量的大小。
- arg遊戲
-
非零元素,作為一個字典,元組的列表,或兩個排序的列表包含指數和價值觀。
例子
> > >向量。稀疏的(4,{1:1.0,3:5.5})SparseVector (4, {1: 1.0, 3: 5.5})> > >向量。稀疏的(4,((1,1.0),(3,5.5)))SparseVector (4, {1: 1.0, 3: 5.5})> > >向量。稀疏的(4,(1,3),(1.0,5.5])SparseVector (4, {1: 1.0, 3: 5.5})
-
靜態
squared_distance
( v1:pyspark.ml.linalg.Vector,v2:pyspark.ml.linalg.Vector )→numpy.float64¶ -
方兩個向量之間的距離。a和b可以SparseVector類型,DenseVector, np。ndarray或array.array。
例子
> > >一個=向量。稀疏的(4,((0,1),(3,4)))> > >b=向量。密集的([2,5,4,1])> > >一個。squared_distance(b)51.0
-
靜態
0
( 大小:int )→pyspark.ml.linalg.DenseVector ¶
-
靜態