09-08-201612:01
像熊貓我通常做df (' columnname '] .unique ()
04-04-201705:07點
df.select (“columnname”) .distinct(),告訴()
12-16-201805:14點
這段代碼返回的數據不是iterable,例如我看到不同的數據位無法遍曆代碼。讓我去做任何其他方式。我試著使用toPandas()將它轉換成熊貓df然後iterable具有獨特的價值。然而,跑到“熊貓沒有發現的錯誤消息。我如何安裝熊貓我pyspark env,如果本地已經有熊貓運行!
08-06-202110:45點
如果你隻是想打印結果和不使用其他處理的結果,這是路要走。
06-14-201708:14點
嗨,試著用.distinct(),告訴()的建議,但我得到了錯誤TypeError: DataFrame對象不是可調用的。
dataframe讀在使用spark.read從csv文件。csv,其他功能描述在df工作。原因嗎?我應該如何檢索列表中惟一的值在這種情況下嗎?
對不起,如果問題是非常基本的。新手。謝謝!
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。