取消
顯示的結果
而不是尋找
你的意思是:

火花流:檢查點不承認新數據

mriccardi
新的貢獻者二世

大家好!

我們目前麵臨的問題不是更新新的數據流從7月20日。

我們表有數據驗證和青銅銀沒有。

也看到日誌銀流運行但是寫0文件。

OffsetSeqLog: BatchIds發現清單:0 22/07/26 OffsetSeqLog 12:45:14信息:獲取最新抵消0 22/07/26 12:45:14信息CommitLog: BatchIds發現清單:0 22/07/26 CommitLog 12:45:14信息:獲取最新抵消0 22/07/26 MicroBatchExecution 12:45:14信息:查詢開始:去年開始microbatch抵消信息=一些((0,[{“sourceVersion”: 1、“reservoirId”:“271090 ee - 5 - d4b - 4087 - a6a0 - 5 - a9760d969d8”、“reservoirVersion”: 916406年,“指數”:1、“isStartingVersion”:假}))),最後成功完成microbatch抵消信息=一些((0,CommitMetadata(0))) 22/07/26 12:45:14信息OffsetSeqLog: BatchIds發現清單:0 22/07/26 OffsetSeqLog 12:45:14信息:獲取最新抵消0 22/07/26 12:45:15信息CommitLog: BatchIds發現清單:0 22/07/26 CommitLog 12:45:15信息:獲取最新抵消0

基本上工作表讀取青銅,應用一些轉換和寫信給我們的銀路徑。

bronze_df =火花\ .readStream \ .format(“δ”)\ .load (str (INPUT_PATH)) df =變換(bronze_df) pc_df = df \ .writeStream \ .outputMode(“追加”)\ .trigger(一次= True) \ .format(“δ”)\ .option (“checkpointLocation”, CHECKPOINT_PATH) \ .partitionBy (“event_date”、“event_hour”,“ad_type”) \ .queryName (f prod_silver_v2) \ .start (OUTPUT_PATH)

添加:上周我們重新加工這個表中實現它。在我們第一次運行(8 hs)的最後一步就是優化銀表和工作失敗的一步。之後我們看到桌上有預期的數據,但在運行我們無法更新此表。

這有關嗎?

有什麼辦法可以“恢複”檢查點之前的狀態嗎?

提前謝謝!

3回複3

mriccardi
新的貢獻者二世

也觸發配置為運行一次,但是當我們開始工作它永遠不會結束,它使在一個無限循環中。

你誤刪除關卡嗎?如果你做了,那麼你可以使用“startingVersio”來定義抵消版本,你想開始閱讀。這是更多的文檔https://docs.www.eheci.com/delta/delta-streaming.html specify-initial-position

嗨@Martin Riccardi,

隻是一個友好的後續。你看到我以前的反應了嗎?它幫助你嗎?請讓我們知道

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map