Azure磚統一分析平台是Databricks和Beplay体育安卓版本微軟聯合產品/工程努力的結果。它可以作為Azure公共雲上的托管第一方服務使用。除了一鍵設置(手動/自動),集群管理(包括δ),beplay娱乐ios協作工作空間,該平台與其Beplay体育安卓版本他Azure第一方服務進行了本地集成,例如Azure Blob存儲, Azure數據湖存儲(Gen1/代),Azure SQL數據倉庫,Azure宇宙DB,Azure的活動中心,Azure數據工廠等等,而且這個名單還在不斷增加。
此外,該平台建立在強大的安全基礎上,Beplay体育安卓版本提供本地集成Azure活動目錄(AAD);並符合iso27001、SOC 2 type2、HIPAA等主要安全認證。該服務由Microsoft sla和支持支持支持。
在本博客中,我們將概述Azure Databricks平台架構,以及如何在自己的管理中部署集群Beplay体育安卓版本Azure聯接.
Beplay体育安卓版本平台架構
Azure Databricks是管理應用程序,由兩個高級組件組成:
- 控製平麵—存儲係統中的管理層Microsoft-managedAzure訂閱,包括集群管理器、web應用程序、作業服務等服務。每個服務都有自己的機製,根據工作空間標識符隔離處理、元數據和資源,然後使用工作空間標識符執行每個請求。
- 數據平麵-由一個鎖定的虛擬網絡(Azure聯接)customer-managedAzure訂閱。所有集群都在該VNET中創建,所有數據處理都在駐留在客戶管理的源中的數據上進行。
Beplay体育安卓版本平台架構——在默認部署模式下(上圖),數據平麵VNET和網絡安全組(NSG)由微軟管理,盡管這些是在客戶的訂閱中提供的。這些資源被“鎖定”以防止客戶的任何更改,類似於其他Azure第一方服務的操作方式。目標是使其易於使用,並避免用戶進行非預期的更改。
可以使用特定於Azure databicks的Azure雲vnet來對等其他Azure雲vnetVNET凝視功能,通過連接到內部數據源ExpressRoute或者一個VPN網關在此部署模式下是不可能的(有關如何實現該連接,請進一步閱讀)。
自帶VNET
盡管默認部署模式適用於許多企業,但許多企業客戶希望對業務網絡配置有更多的控製,以遵守內部雲/數據治理策略和/或遵守外部法規,和/或進行網絡定製,例如:beplay体育app下载地址
- 將Azure Databricks集群安全地連接到其他Azure數據服務Azure服務端點
- 將Azure Databricks集群連接到部署在私有/共享數據中心的數據源(本地)
- 隻將來自Azure Databricks集群的出站流量限製到特定的Azure數據服務和/或外部端點
- 配置Azure Databricks集群使用定製的DNS
- 配置自定義CIDRAzure Databricks集群的範圍
- 和更多的
為使上述工作成為可能,我們提供了一份自帶VNET(也稱為VNET注入)特性,它允許客戶在他們自己管理的VNET中部署Azure Databricks集beplay体育app下载地址群(數據平麵)。這樣的工作空間可以使用Azure門戶,或以自動的方式使用手臂模板,它可以使用Azure CLI,Azure Powershell,Python Azure SDK等。
有了這個功能,Databricks工作區NSG也由客戶管理。我們經營一套NSG inbound和outbound規則使用網絡意圖策略,因為這些是與控製/管理平麵進行安全的雙向通信所必需的。帶有onBeplay体育安卓版本-prem連接(可選)的平台架構如下所示:
使用自帶VNET/VNET注入功能,可以配置:
- 到內部數據源的連接(需要白名單的Databricks控製平麵流量使用Azure一起使用)
- 通過防火牆設備/服務的出站通信的路由
- 將Azure Databricks子網配置為Azure Blob存儲、Azure數據湖存儲、Azure SQL數據倉庫等防火牆規則中的源——需要Azure服務端點
- 還有之前討論過的其他事情。
這允許客戶遵守各種內部和beplay体育app下载地址外部安全策略和框架,同時維護服務的PaaS性質,從而為托管平台提供與默認部署模式相同的易用性。Beplay体育安卓版本
該特性今天已經公開預覽,在所有Azure Databricks區域都有完整的生產sla。一般的可用性很快就會出現。
試一試!
- 如果您還沒有使用Azure Databricks,您可以通過以下內容進行嚐試這些方向.