pyspark.sql.functions.aggregate¶
-
pyspark.sql.functions。
總
( 上校:ColumnOrName,initialValue:ColumnOrName,合並:可調用的((pyspark.sql.column.Column,pyspark.sql.column.Column],pyspark.sql.column.Column],完成:可選(可調用的((pyspark.sql.column.Column],pyspark.sql.column.Column]]=沒有一個 )→pyspark.sql.column.Column¶ -
二進製運算符適用於初始狀態和所有元素的數組,並減少這一狀態。最終的狀態轉化為最終結果通過應用一個函數完成。
兩個函數可以使用的方法
列
、函數中定義pyspark.sql.functions
和ScalaUserDefinedFunctions
。PythonUserDefinedFunctions
不支持(火星- 27052)。- 參數
- 返回
例子
> > >df=火花。createDataFrame(((1,(20.0,4.0,2.0,6.0,10.0])),(“id”,“價值觀”))> > >df。選擇(總(“價值觀”,點燃(0.0),λacc,x:acc+x)。別名(“和”))。顯示()+ - - - +|和|+ - - - +| 42.0 |+ - - - +
> > >def合並(acc,x):…數=acc。數+1…總和=acc。總和+x…返回結構體(數。別名(“數”),總和。別名(“和”))> > >df。選擇(…總(…“價值觀”,…結構體(點燃(0)。別名(“數”),點燃(0.0)。別名(“和”)),…合並,…λacc:acc。總和/acc。數,…)。別名(“的意思是”)…)。顯示()+ - - - +|是|+ - - - +| 8.4 |+ - - - +