取消
顯示的結果
而不是尋找
你的意思是:

如何獲得獨特的一個列的值pyspark dataframe嗎

薩提亞
新的因素

像熊貓我通常做df (' columnname '] .unique ()

10個回答10

Rodneyjoyce
新的貢獻者三世

得到不同值的計算:

df.select (F.countDistinct (“colx”)),告訴()

或者把記錄的數量為每個不同的價值:

.orderBy df.groupBy (colx) .count()(),告訴()

AnujGupta
新的貢獻者二世

感謝。後者對我工作得很好。但是,對不起,我的無知但F在第一個是什麼?代碼工作沒有f !後者對我工作得很好。

ldfo
新的貢獻者二世

嗨,這為我工作。

distinct_ids = [x。id為data.select x (id) .distinct () .collect ())

Ger_Martinez
新的貢獻者二世

不錯,也很“python化”的思想

AbimaelDomingue
新的貢獻者二世

如果您想要使用的值做一些處理,這是路要走。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map