01-27-202209:02我
我們的建築是根據領域驅動設計。數據分布在不同的領域。
我們想要運行的工作負載上的數據,但是我們想避免湖有一個專用的(重複)數據隻是為了磚。相反,我們寧願喜歡直接依賴於我們自己的數據源(通過REST api)為了總是運行在相同的,最新的數據。
有人能告訴我一些資源才能開始?將肯定沒事的我們之間有一個抽象層中使用一個筆記本和我們的後端api如何看起來像…
01-27-2022下午11:13
所以你不想保存數據以外的源係統。
我認為所謂的“Kappa架構”可能是一個健康,一切都是當作一個流。
休伯特已經提到卡夫卡,這是一個很好的構建(還有其他)。和最重要的是您可以使用火花,或者Flink之類的。
還有Apache Nifi Streamsets和…
Kappa架構是很酷,但不是沒有缺點。
也很近數據網格的,提供數據被視為域。這可能是一個適合你的用例。
但是這種方法當然也有它的缺陷(例如治理、巨大的開銷)
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。