取消
顯示的結果
而不是尋找
你的意思是:

結構化流中維護自定義狀態

Starki
新的貢獻者二世

我使用一個物聯網使用結構化流流與成千上萬的不同信號。在處理流,我需要知道前麵的時間戳和價值為每個信號在微觀批處理。最終信號流寫入一個三角洲表。每個信號將發送每小時至少一次。

有可能利用內部狀態存儲作為緩存來存儲這個自定義狀態之前的時間戳和價值為每個信號?

如果不是,什麼是規範化方法來維持這樣一個狀態?

這是我能想到的方法。

方法1:

流與目標表上執行一個連接本身得到前麵的信號時間戳和價值。

方法2:

維護一個單獨的“狀態表”包含前麵的時間戳和價值為每個信號。“狀態表”將與前流的信號時間戳和價值。

在收到新的信號值,將會更新狀態表的使用合並。

1回複1

Soma
價值貢獻

@Suteja卡努裏人

嚐試上述流DF

但麵臨以下錯誤

AttributeError:“DataFrame”對象沒有屬性“groupByKey”

你能請讓我知道DBR運行時嗎

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map