Delta Lake Data Egestion演示

自由開始

背景圖

使用DataBricks自動加載程序,您可以在到達數據湖中時逐步和有效地將新的批量和實時流數據文件進入Delta Lake表 - 以便他們始終包含最完整和最新的數據可用的。自動加載器是一個簡單,靈活的工具,可以連續運行,也可以在“Triggeronce”模式下進行批量處理數據。SQL用戶可以使用簡單的“複製到”命令將新數據從其自動將新數據拉到他們的Delta Lake表中,而無需跟蹤已經處理了哪些文件。

查看演示的完整列表→

下載筆記本

筆記本#1筆記本#2

深入進入DataBricks平台Beplay体育安卓版本

視頻成績單

使用自動裝載機將數據進入Delta湖泊

將原始數據加載到數據倉庫中可能是一個淩亂,複雜的過程,但使用Databricks,填充您的Delta Lake,可用的最新鮮數據從未如此簡單。

在這裏,我們使用的是一些來自IoT設備的JSON遙測數據,比如跟蹤步驟的智能手表。每5秒就有新的數據文件進入我們的數據湖,所以我們需要一種方法自動將它們輸入三角洲湖。Auto Loader提供了一個新的名為“cloudFiles”的結構化流數據源,我們可以使用它來實現這一點。

返回頂部→

背景圖

嚐試免費14天免費

點擊“免費開始”,即表示您同意隱私政策服務條款

準備開始嗎?

Baidu
map