08-01-2018下午09:36
有辦法防止_success和_committed文件輸出。這是一個乏味的任務導航到所有分區和刪除文件。
注:最終輸出存儲在Azure ADLS
08-03-201804:15我
這是我推薦StackOverflow雖然還沒有與ADLS測試。
sc._jsc.hadoopConfiguration()這裏(“mapreduce.fileoutputcommitter。marksuccessfuljobs”、“假”)
注意它可能影響整個集群。
你也可以使用dbutils.fs。刪除任何rm一步創建的文件。
歡呼,
安德魯
08-07-2018淩晨04:30
這個解決方案是在本地intellij設置工作但不是磚筆記本的設置。
08-07-201808:46我
你嚐試用一個新的磚集群使用初始化腳本?
https://docs.www.eheci.com/user-guide/clusters/init-scripts.html
01-24-202004:53我
下麵三個屬性的組合將有助於禁用寫所有的事務性文件從“_”開始。
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。