pyspark.sql.DataFrameStatFunctions.crosstab¶
-
DataFrameStatFunctions。
交叉表
( col1:str,col2:str )→pyspark.sql.dataframe.DataFrame¶ -
計算兩兩頻率給定的表列。也稱為列聯表。每一列的不同值的數量應該小於1 e4。最多1 e6零頻率將被返回。每一行的第一列中不同值的col1和列名稱的不同值col2。第一列的名稱col1_ col2美元。對沒有出現零作為他們的數量。
DataFrame.crosstab ()
和DataFrameStatFunctions.crosstab ()
別名。- 參數
-
- col1 str
-
第一列的名稱。不同的物品會讓每一行的第一個項目。
- col2 str
-
第二列的名稱。不同的項目將列的名稱
DataFrame
。