pyspark.sql.DataFrameStatFunctions.freqItems

DataFrameStatFunctions。 freqItems ( 關口:列表(str],支持:可選(浮動]=沒有一個 )→pyspark.sql.dataframe.DataFrame

發現頻繁項目列,可能與假陽性。使用頻繁的元素中描述計數算法”https://doi.org/10.1145/762471.762473提出的,卡普,辛克物流,Papadimitriou”。DataFrame.freqItems ()DataFrameStatFunctions.freqItems ()別名。

參數
關口 列表或元組

的名字列計算頻繁項的列表或元組字符串。

支持 浮動,可選

考慮一個項目的頻率“頻繁”。默認是1%。支持必須大於1的軍醫。

筆記

這個函數是用於探索性數據分析,我們不能保證向後兼容的模式產生的DataFrame