取消
顯示的結果
而不是尋找
你的意思是:

有什麼簡單的方法將數據插入到一個表嗎?(Azure ADLS代)

網狀的
新的貢獻者三世

我一直試圖插入行到一個表在Azure Blob存儲(ADLS Gen 2)基於兩個分區(下麵的示例代碼)。

插入覆蓋表new_clicks_table分區(client_id mm_date)選擇click_id user_id, click_timestamp_gmt, campaign_id, site_url, client_id, mm_date從old_clicks_table mm_date之間的“2022-12-01”和“2022-12-07”和client_id (123456);

然而,使用“插入覆蓋”刪除所有以前的數據表,不僅基於給分區更新數據(即:表中所有數據刪除客戶機ID 123456 2022-12-01,我之前隻剩下數據從2022-12-01到2022-12-07)。

最簡單的方法是什麼表插入數據到我的隻有我的查詢中指定的分區和留住我剩下的數據?

這可以通過使用“插入”和“覆蓋”或我需要使用“合並”嗎?如果是後者,有人可以提供最好的例子如何寫這個數據使用“合並”?

5回複5

ajaypanday6781
尊敬的貢獻者二世

下麵的代碼可能幫助你

Python - (df。寫.mode(“覆蓋”).option .saveAsTable (“partitionOverwriteMode”、“動態”)(“default.people10m”)) SQL -設置spark.sql.sources.partitionOverwriteMode =動態;插入表默認覆蓋。從更多人people10m SELECT *;

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map