pyspark.pandas.DataFrame.dot

DataFrame。 ( 其他:係列 )→係列

計算DataFrame和其他之間的矩陣乘法。

這種方法計算矩陣乘積DataFrame和一係列其他的值

它也可以被使用自我@其他在Python中> = 3.5。

請注意

這種方法是基於一項昂貴的操作由於大數據的性質。內部需要為每個值生成每一行,然後組織兩次——這是一個巨大的操作。為了防止誤用,這種方法的計算。max_rows默認的輸入長度限製,引發了ValueError。

> > >pyspark.pandas.config進口option_context> > >option_context(“compute.max_rows”,1000年,“compute.ops_on_diff_frames”,真正的):psdf=psDataFrame({“一個”:範圍(1001年)})ps=ps係列([2),指數=(“一個”])psdf(ps)回溯(最近的電話):ValueError:當前DataFrame超過給定的限製1000行。請設定計算。max_rows”通過“pyspark.pandas.config.set_option”檢索檢索超過1000行。注意,在改變之前“compute.max_rows”,this operation is considerably expensive.
參數
其他 係列

計算的矩陣乘積的其他對象。

返回
係列

回歸自我和他人之間的矩陣乘積作為一個係列。

另請參閱

Series.dot

類似的方法係列。

筆記

DataFrame和其他必須一致的尺寸來計算矩陣乘法。此外,DataFrame列名和其他必須包含相同值的指數,因為他們將乘法前保持一致。

點的係列計算內積的方法,而不是這裏的矩陣乘積。

例子

> > >pyspark.pandas.config進口set_option,reset_option> > >set_option(“compute.ops_on_diff_frames”,真正的)> > >psdf=psDataFrame([[0,1,- - - - - -2,- - - - - -1),(1,1,1,1]])> > >ps=ps係列([1,1,2,1])> > >psdf(ps)0 41 - 5dtype: int64

注意轉移的對象不會改變結果。

> > >psser2=ps重建索引([1,0,2,3])> > >psdf(psser2)0 41 - 5dtype: int64> > >psdf@psser20 41 - 5dtype: int64> > >reset_option(“compute.ops_on_diff_frames”)