你好,我是非常新磚,我發現很難如果它是正確的解決方案為我們的需求。
要求:
我們有多個數據源分布在AWS S3和Postgres。我們需要一個常見的SQL端點,可以用來編寫查詢加入數據在這些不同的商店。
例如:
我們有一個BI工具,在JDBC連接到數據源。然而這個BI工具不能“加入”跨多個數據源的數據。我可以用磚來解決這個問題嗎?
在BI工具,我應該能夠連接到磚在JDBC和編寫SQL查詢
從S3.Schema1選擇*。表1為s, Postgres.Schema2。表二是p, s。x = p.y;
和這個新Databrick SQL端點應該總是可用24 * 7就像一個正常的數據庫實例。這是可能的嗎?
PS:我知道我可以“進口”Postgres數據到S3,然後使連接。但是我們需要實時連接沒有進口。
是的,你可以。湖可以ETL數據存儲寄存器表metastore和注冊您的選擇與連接視圖或更好的創建另外的工作和存儲你的加入表。從BI可以連接到磚sql或湖的數據存儲。