pyspark.sql.DataFrameStatFunctions.freqItems¶
-
DataFrameStatFunctions。
freqItems
( 關口:列表(str],支持:可選(浮動]=沒有一個 )→pyspark.sql.dataframe.DataFrame¶ -
發現頻繁項目列,可能與假陽性。使用頻繁的元素中描述計數算法”https://doi.org/10.1145/762471.762473提出的,卡普,辛克物流,Papadimitriou”。
DataFrame.freqItems ()
和DataFrameStatFunctions.freqItems ()
別名。- 參數
-
- 關口 列表或元組
-
的名字列計算頻繁項的列表或元組字符串。
- 支持 浮動,可選
-
考慮一個項目的頻率“頻繁”。默認是1%。支持必須大於1的軍醫。
筆記
這個函數是用於探索性數據分析,我們不能保證向後兼容的模式產生的
DataFrame
。