08-25-201904:47我
我試圖複製SQL數據庫等功能維持在Databrciks三角洲主鍵的方法,數據被寫入Blob存儲如ADLS2 oe AWS S3。
我想要一個自動遞增主鍵功能使用磚三角洲。
現有的方法,是使用最新的行數和維護主鍵。然而,這種方法不適合並行處理環境中,主鍵重複數據。
08-26-2019家族
嗨@Aditya Deshpande
沒有鎖定機製的PK三角洲。您可以使用df row_number()函數和節約使用寫前三角洲和做不同的()。
08-27-2019吸我
這是我們使用現有的方法。但這限製運行時多集群環境中寫數據到相同的目的地。
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。