pyspark.sql.DataFrame.crosstab

DataFrame。 交叉表 ( col1:str,col2:str )→pyspark.sql.dataframe.DataFrame

計算兩兩頻率給定的表列。也稱為列聯表。每一列的不同值的數量應該小於1 e4。最多1 e6零頻率將被返回。每一行的第一列中不同值的col1和列名稱的不同值col2。第一列的名稱col1_ col2美元。對沒有出現零作為他們的數量。DataFrame.crosstab ()DataFrameStatFunctions.crosstab ()別名。

參數
col1 str

第一列的名稱。不同的物品會讓每一行的第一個項目。

col2 str

第二列的名稱。不同的項目將列的名稱DataFrame