取消
顯示的結果
而不是尋找
你的意思是:

誤差在更新表com.databricks.sql.transaction.tahoe三角洲。DeltaUnsupportedOperationException:檢測到數據更新

桑傑
價值貢獻

你好,

我有管道。我已經更新一個文件在三角洲表已處理。現在我得到錯誤

com.databricks.sql.transaction.tahoe。δUnsupportedOperationException: Detected a data update. This is currently not supported. If you'd like to ignore updates, set the option 'ignoreChanges' to 'true'.

我已經設置ignoreChanges真實但仍然得到同樣的錯誤。

spark.readStream.format(“δ”)

.option (“ignoreChanges”,“真正的”)

.load (“/ tmp /δ/ user_events”)

問候,

桑傑

7回複7

桑傑
價值貢獻

我能看到ignoreChanges真正發出的所有更新+發出unupdated文件相同的分區。根據文檔,需要處理重複在下遊。你能建議如何處理重複的文件。

這是來自databrick文檔。(https://docs.www.eheci.com/structured-streaming/delta-lake.html # ignore-updates-and-deletes)

“語義從skipChangeCommits ignoreChanges有很大的不同。啟用了ignoreChanges,改寫源表中的數據文件後重新發出的數據修改操作,比如更新、合並,刪除(分區),或覆蓋。不變行往往發出與新行,所以下遊消費者必須能夠處理重複。刪除不是下遊傳播。ignoreChanges包容ignoreDeletes。”

Vidula_Khanna
主持人
主持人

嗨@Sanjay耆那教徒的

希望一切進行得很順利。

隻是想檢查如果你能解決你的問題。如果是的,你會很高興的答案標記為最好,其他成員可以找到解決方案更快嗎?如果不是,請告訴我們,我們可以幫助你。

幹杯!

嗨Vidula,

對不起我仍然尋找解決方案。感激如果你能提供任何的幫助。

問候,

桑傑

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map