09-08-201612:01
像熊貓我通常做df (' columnname '] .unique ()
04-22-201904:18我
得到不同值的計算:
df.select (F.countDistinct (“colx”)),告訴()
或者把記錄的數量為每個不同的價值:
.orderBy df.groupBy (colx) .count()(),告訴()
11-22-202001:36點
感謝。後者對我工作得很好。但是,對不起,我的無知但F在第一個是什麼?代碼工作沒有f !後者對我工作得很好。
07-01-202003:05點
嗨,這為我工作。
distinct_ids = [x。id為data.select x (id) .distinct () .collect ())
09-02-202008:03我
不錯,也很“python化”的思想
08-06-202110點43分
如果您想要使用的值做一些處理,這是路要走。
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。