解決:最簡單的方法將數據插入到表……頁2 -磚- 17789

網狀的 · ‎12-08-2022

我一直試圖插入行到一個表在Azure Blob存儲(ADLS Gen 2)基於兩個分區(下麵的示例代碼)。

插入覆蓋表new_clicks_table分區(client_id mm_date)選擇click_id user_id, click_timestamp_gmt, campaign_id, site_url, client_id, mm_date從old_clicks_table mm_date之間的“2022-12-01”和“2022-12-07”和client_id (123456);

然而,使用“插入覆蓋”刪除所有以前的數據表,不僅基於給分區更新數據(即:表中所有數據刪除客戶機ID 123456 2022-12-01,我之前隻剩下數據從2022-12-01到2022-12-07)。

最簡單的方法是什麼表插入數據到我的隻有我的查詢中指定的分區和留住我剩下的數據?

這可以通過使用“插入”和“覆蓋”或我需要使用“合並”嗎?如果是後者,有人可以提供最好的例子如何寫這個數據使用“合並”?

ajaypanday6781 · ‎12-08-2022

下麵的代碼可能幫助你

Python - (df。寫.mode(“覆蓋”).option .saveAsTable (“partitionOverwriteMode”、“動態”)(“default.people10m”)) SQL -設置spark.sql.sources.partitionOverwriteMode =動態;插入表默認覆蓋。從更多人people10m SELECT *;

磚

有什麼簡單的方法將數據插入到一個表嗎?(Azure ADLS代)