磚
SQL演示
免費開始
Databricks SQL是Lakehouse上的無服務器數據倉庫,提供比其他雲數據倉庫高12倍的價格/性能。
視頻記錄
Databricks SQL演示概述
大家好,正如你所聽說的,湖屋是最好的數據倉庫,因為它結合了數據倉庫的速度和數據湖的規模和靈活性。在這個演示中,我將向您展示數據團隊如何使用Databricks SQL (Databricks Lakehouse平台上的無服務器數據倉庫)為一家大型跨國公司分析收入趨勢。Beplay体育安卓版本
點擊展開文字記錄→
首先,讓我們尋找用於分析的收入數據。因為lakehouse可能包含成千上萬的數據對象,比如表或視圖,你可以使用Unity Catalog內置的搜索功能來跨表、查詢和儀表板查找相關數據。您將隻看到您有權訪問的數據的結果,因為Unity Catalog管理湖屋。讓我們按國家選擇收入趨勢,這會打開數據瀏覽器。
數據資源管理器顯示您可以訪問的所有目錄、模式、表和視圖。在數據資源管理器中,您將看到這個對象的結構,例如列名、數據類型和注釋。您可以預覽示例數據、可視化地檢查對象內容或查看元數據信息——在這種情況下,您將看到視圖定義。您可以向用戶或組授予或限製訪問權限,授權他們通過熟悉的SQL語法讀取或修改此數據對象或管理訪問控製。
最後,沿襲向您展示了數據如何在湖屋中上遊或下遊流動。在這裏,您可以看到收入趨勢是如何被其他表格、筆記本電腦、工作流或儀表板所衍生或消耗的。或者,高保真的沿襲圖以圖形方式顯示數據流。您可以遍曆此圖並探索有助於分析的其他數據資產。例如,您可以考慮使用由訂單派生的按優先級表的收入預測。
通常,您可能需要增加來自多個源的數據。要攝取數據到湖屋,Databricks SQL允許您添加來自各種本機集成源的數據,或將您的數據與您喜歡的工具(如Fivetran)連接。
讓我們回到數據資源管理器。
了解了這個數據集的上下文之後,就可以創建查詢或快速儀表板了。但是,讓我們看看表洞察,看看是否有使用相同表的現有查詢可以加速分析。
Databricks SQL提供了一個功能齊全的SQL編輯器,允許您編寫、運行和調度查詢。正如您所看到的,這是一個熟悉的ANSI SQL語句——從多個表中讀取,並根據區域確定總收入的特定標準——您可以修改此查詢以滿足您的需求。該查詢將在無服務器SQL倉庫上執行,該倉庫幾秒鍾就能上線,並針對高並發工作負載進行了優化,所需的管理最少,容量優化可降低總體成本。
當查詢執行時,您可以使用查詢概要來查看查詢執行的詳細信息,這可以通過詳細說明每個任務的操作來幫助您排除查詢執行期間的性能瓶頸。
當查詢結果返回時,在同一個編輯器中,Databricks SQL使您能夠創建可視化。對於這個查詢,Databricks SQL會自動建議一個可視化類型,但是您可以選擇使用開箱即用的圖表類型進行自定義。
SQL是偉大的,但你可能需要額外的功能超出了SQL可表達的,隨著Python udf的引入,你可以使用Python在Databricks SQL中定義自定義函數,這些函數可以被稱為SQL語句和查詢的一部分。例如,在預測數據集中屏蔽電子郵件等PII數據。
在另一種場景中,您的數據可能駐留在lakehouse之外的各種企業生產係統中。在這種情況下,您可以使用查詢聯合直接連接到多個數據源,您可以使用自動和智能下推技術配置到遠程數據庫的隻讀連接,以獲得更好的性能—在本例中,我們將預測特定區域的未來收入。
最後,Databricks SQL支持物化視圖,通過高效的增量計算加速最終用戶查詢並降低基礎設施成本。在這裏,我們將創建用於BI和分析的最新的、聚合的順序優先級視圖,而不必重新處理完整的底層表,而是隻在發生更改的地方更新。
現在,許多組織都有各種BI工具,如Tableau或PowerBI。使用Databricks SQL,您可以無縫集成現有的BI工具。當我們切換到Tableau時,數據分析師可以通過與我們在演示中使用的Databricks無服務器SQL倉庫即時訪問lakehouse數據,以獲得進一步可操作的見解,以推動收入增長。
總之,您已經看到了Databricks SQL(無服務器數據倉庫)如何允許數據團隊安全地在lakehouse平台上查找數據、編寫和運行特別查詢、創建豐富的開箱即用可視化以及連接到您最喜歡的BI工具(如Tableau)來分析大型跨國組織的收入趨勢。Beplay体育安卓版本
謝謝你!
準備開始了嗎?