跳轉到主要內容
公司博客上

90 +數據源連接到Azure磚和Azure湖數據工廠

分享這篇文章

得到的早期預覽O ' reilly的新電子書一步一步的指導你需要開始使用三角洲湖。


數據的湖泊使組織能夠始終如一地交付價值和洞察力通過安全、及時獲得各種數據源。旅程的第一步就是編排和自動化攝入與健壯的數據管道。作為數據數量、種類和速度迅速增加,有一個更大的可靠和安全的管道需要提取、轉換和加載(ETL)數據。

磚客戶過程每個月兩個ebeplay体育app下载地址b(20億字節)的數據Azure磚是增長最快的數據與人工智能服務微軟Azure今天。Azure磚之間的緊密集成和其他Azure服務使客戶能夠簡化和規模數據攝入管道。beplay体育app下载地址例如,集成Azure Active Directory (Azure廣告)使一致的基於雲的身份和訪問管理。同時,與湖Azure數據存儲集成(ADLS)提供高度可伸縮的、安全的存儲大數據分析和Azure數據工廠(ADF)使大規模混合簡化ETL數據集成。

批處理與微軟Azure ETL數據工廠和Azure磚

圖:批ETL Azure數據工廠和Azure磚

連接、攝取和轉換數據用一個工作流

ADF包括90 +內置數據源連接器並無縫地運行Azure磚筆記本和攝取所有的數據源連接成一個單一數據湖。ADF還提供內置的工作流控製、數據轉換、管道調度、數據集成和更多的功能來幫助您創建可靠的數據管道。ADF使客戶能夠攝取原始beplay体育app下载地址格式的數據,然後提煉數據,將其轉化為青銅、白銀和黃金表Azure磚和三角洲湖。例如,客戶經常使用Azurbeplay体育app下载地址e ADF磚三角洲湖啟用SQL查詢的數據的湖泊和建立機器學習的數據管道

青銅、白銀、黃金表Azure的磚,Azure數據工廠,三角洲湖

開始使用Azure磚和Azure數據的工廠

運行一個Azure磚筆記本使用Azure數據工廠,導航到Azure門戶和搜索“數據工廠”,然後單擊“創建”來定義一個新的數據工廠。

創建一個數據工廠從Azure門戶

接下來,為數據工廠提供一個唯一的名稱,選擇訂閱,然後選擇一個資源組和地區。單擊“創建”。

定義一個新的數據工廠

一旦創建,單擊“資源”按鈕來查看工廠的新數據。

點擊去資源數據工廠部署完成後

現在打開數據工廠用戶界麵通過點擊“作者&監控”瓷磚。

工廠準備好作者&監控數據

從Azure數據工廠“讓我們開始”頁麵,點擊左側麵板的“作者”按鈕。

Azure數據工廠讓我們開始吧

接下來,點擊“連接”在屏幕的底部,然後單擊“新”。

數據工廠聯係

從“新鏈接服務”窗格中,單擊“計算”選項卡,選擇“Azure磚”,然後單擊“繼續”。

Azure磚與計算服務

Azure磚與服務輸入一個名稱,並選擇一個工作區。

名字Azure磚與服務

創建一個訪問令牌從Azure磚工作區單擊用戶在屏幕右上角的圖標,然後選擇“用戶設置”。

用戶設置

點擊“生成新的令牌”。

生成新的令牌

令牌複製並粘貼到鏈接的服務形式,然後選擇一個集群的版本,大小和Python版本。審查所有的設置,然後單擊“創建”。

選擇集群版、節點類型和Python版本

與相關服務,是時候創建一個管道。從Azure數據工廠的用戶界麵,點擊加號(+)按鈕,並選擇“管道”。

添加一個ADF管道

添加一個參數通過單擊“參數”選項卡,然後單擊加號(+)按鈕。

添加一個管道參數

接下來,添加一個磚筆記本管道通過擴大“磚”活動,然後拖拽一個磚筆記本到管道設計畫布。

通過選擇“連接到Azure磚工作區Azure磚"選項卡並選擇上麵創建的鏈接服務。接下來,單擊“設置”選項卡指定筆記本路徑。現在點擊“驗證”按鈕,然後“發布”發布ADF服務。

驗證ADF的數據管道

發布更改工廠

一旦發表,引發管道運行通過點擊“添加現在觸發|”。

觸發一個管道運行

檢查參數,然後單擊“Finish”引發管道運行。

設置參數和管道運行觸發

現在切換到“監控”選項卡左邊麵板上看到管道運行的進程。

監控管道運行

將Azure磚筆記本集成到Azure數據工廠管道參數化提供了一個靈活的、可伸縮的方法和實施定製ETL代碼。了解更多關於如何Azure磚與Azure數據集成工廠(ADF),看到的這ADF博客這個ADF教程。想要了解更多關於如何在您的數據探索和查詢數據,看到這個網絡研討會,使用SQL來查詢您的數據與三角洲湖湖

免費試著磚

相關的帖子

看到所有公司博客上的帖子
Baidu
map