10-13-2021下午05:45
每列在dataframe顯示所有不同值
問題陳述:
我想看到所有的不同值每列我整個表,但一個SQL查詢collect_set()在每一列寫不是動態的,太長時間。
使用這個代碼顯示下麵的輸出:
%從pyspark.sql python。功能導入坳,collect_set不同= df.agg (* (collect_set (col (c)) .alias (c)在df.columns c)) distincts.display ()
10-14-202110
@Artem Yevtushenko——這是太棒了!謝謝你的分享!
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。