08-29-2022下午07:56
你好,專家,
我的新磚。構建數據管道,我都批處理和流數據。
我應該使用Dataframes API來讀取csv文件然後轉換為拚花格式轉換嗎?
或
寫入表使用CSV然後使用火花SQL轉換嗎?。
欣賞優點和缺點,哪一個更好
謝謝你!
Rathinam
08-30-202201:09點
嗨Rathinam,最好了解管道在這種情況下。使用CSV寫入表,然後使用火花SQL將更快的在一些情況下比另一個。
09-03-202202:02點
嗨@Parthib Rathnam,謝謝你!
讓我們來看看這個,我們會跟進更新。
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。