取消
顯示的結果
而不是尋找
你的意思是:

如何獲得獨特的一個列的值pyspark dataframe嗎

薩提亞
新的因素

像熊貓我通常做df (' columnname '] .unique ()

10個回答10

raela
新的貢獻者三世

df.select (“columnname”) .distinct(),告訴()

AbhishekYada
新的貢獻者二世

這段代碼返回的數據不是iterable,例如我看到不同的數據位無法遍曆代碼。讓我去做任何其他方式。我試著使用toPandas()將它轉換成熊貓df然後iterable具有獨特的價值。然而,跑到“熊貓沒有發現的錯誤消息。我如何安裝熊貓我pyspark env,如果本地已經有熊貓運行!

AbimaelDomingue
新的貢獻者二世

如果你隻是想打印結果和不使用其他處理的結果,這是路要走。

ShuminWu
新的貢獻者二世

嗨,試著用.distinct(),告訴()的建議,但我得到了錯誤TypeError: DataFrame對象不是可調用的。

dataframe讀在使用spark.read從csv文件。csv,其他功能描述在df工作。原因嗎?我應該如何檢索列表中惟一的值在這種情況下嗎?

對不起,如果問題是非常基本的。新手。謝謝!

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map