取消
顯示的結果
而不是尋找
你的意思是:

如何保持主鍵列在磚三角洲多集群環境

AdityaDeshpande
新的貢獻者二世

我試圖複製SQL數據庫等功能維持在Databrciks三角洲主鍵的方法,數據被寫入Blob存儲如ADLS2 oe AWS S3。

我想要一個自動遞增主鍵功能使用磚三角洲。

現有的方法,是使用最新的行數和維護主鍵。然而,這種方法不適合並行處理環境中,主鍵重複數據。

2回答2

girivaratharaja
新的貢獻者三世

嗨@Aditya Deshpande

沒有鎖定機製的PK三角洲。您可以使用df row_number()函數和節約使用寫前三角洲和做不同的()。

這是我們使用現有的方法。但這限製運行時多集群環境中寫數據到相同的目的地。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map