pyspark.sql.functions.map_zip_with

pyspark.sql.functions。 map_zip_with ( col1:ColumnOrName,col2:ColumnOrName,f:可調用的((pyspark.sql.column.Column,pyspark.sql.column.Column,pyspark.sql.column.Column],pyspark.sql.column.Column] )→pyspark.sql.column.Column

合並兩個給定的地圖,key-wise成一個單一的地圖使用一個函數。

參數
col1 或str

第一個列或表達式

col2 或str

名稱,第二列或表達式

f 函數

一個三元函數(k:列,“v1:列,v2:列)- >列……可以使用的方法、函數中定義pyspark.sql.functions和ScalaUserDefinedFunctions。PythonUserDefinedFunctions不支持(火星- 27052)。

返回

例子

> > >df=火花createDataFrame([(1,{“它”:24.0,“銷售”:12.00},{“它”:2.0,“銷售”:1.4})),(“id”,“基地”,“比”))> > >df選擇(map_zip_with(“基地”,“比”,λk,v1,v2:(v1*v2,2))別名(“updated_data”))顯示(截斷=)+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +| updated_data |+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +|{銷售- > 16.8 - > 48.0}|+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +