Azure Databricks -自帶VNET

如何在您自己的自定義VNET中部署Databricks集群

Azure磚統一分析平台是Databricks和Beplay体育安卓版本微軟聯合產品/工程努力的結果。它可以作為Azure公共雲上的托管第一方服務使用。除了一鍵設置(手動/自動),集群管理(包括δ),beplay娱乐ios協作工作空間,該平台與其Beplay体育安卓版本他Azure第一方服務進行了本地集成,例如Azure Blob存儲, Azure數據湖存儲(Gen1/),Azure SQL數據倉庫Azure宇宙DBAzure的活動中心Azure數據工廠等等,而且這個名單還在不斷增加。

此外,該平台建立在強大的安全基礎上,Beplay体育安卓版本提供本地集成Azure活動目錄(AAD);並符合iso27001、SOC 2 type2、HIPAA等主要安全認證。該服務由Microsoft sla和支持支持支持。

在本博客中,我們將概述Azure Databricks平台架構,以及如何在自己的管理中部署集群Beplay体育安卓版本Azure聯接

Beplay体育安卓版本平台架構

Azure Databricks是管理應用程序,由兩個高級組件組成:

  • 控製平麵—存儲係統中的管理層Microsoft-managedAzure訂閱,包括集群管理器、web應用程序、作業服務等服務。每個服務都有自己的機製,根據工作空間標識符隔離處理、元數據和資源,然後使用工作空間標識符執行每個請求。
  • 數據平麵-由一個鎖定的虛擬網絡(Azure聯接)customer-managedAzure訂閱。所有集群都在該VNET中創建,所有數據處理都在駐留在客戶管理的源中的數據上進行。
Beplay体育安卓版本平台架構——默認部署模型

Beplay体育安卓版本平台架構——在默認部署模式下(上圖),數據平麵VNET和網絡安全組(NSG)由微軟管理,盡管這些是在客戶的訂閱中提供的。這些資源被“鎖定”以防止客戶的任何更改,類似於其他Azure第一方服務的操作方式。目標是使其易於使用,並避免用戶進行非預期的更改。

可以使用特定於Azure databicks的Azure雲vnet來對等其他Azure雲vnetVNET凝視功能,通過連接到內部數據源ExpressRoute或者一個VPN網關在此部署模式下是不可能的(有關如何實現該連接,請進一步閱讀)。

自帶VNET

盡管默認部署模式適用於許多企業,但許多企業客戶希望對業務網絡配置有更多的控製,以遵守內部雲/數據治理策略和/或遵守外部法規,和/或進行網絡定製,例如:beplay体育app下载地址

  • 將Azure Databricks集群安全地連接到其他Azure數據服務Azure服務端點
  • 將Azure Databricks集群連接到部署在私有/共享數據中心的數據源(本地)
  • 隻將來自Azure Databricks集群的出站流量限製到特定的Azure數據服務和/或外部端點
  • 配置Azure Databricks集群使用定製的DNS
  • 配置自定義CIDRAzure Databricks集群的範圍
  • 和更多的

為使上述工作成為可能,我們提供了一份自帶VNET(也稱為VNET注入)特性,它允許客戶在他們自己管理的VNET中部署Azure Databricks集beplay体育app下载地址群(數據平麵)。這樣的工作空間可以使用Azure門戶,或以自動的方式使用手臂模板,它可以使用Azure CLIAzure PowershellPython Azure SDK等。

有了這個功能,Databricks工作區NSG也由客戶管理。我們經營一套NSG inbound和outbound規則使用網絡意圖策略,因為這些是與控製/管理平麵進行安全的雙向通信所必需的。帶有onBeplay体育安卓版本-prem連接(可選)的平台架構如下所示:

Beplay体育安卓版本平台架構——VNET注入部署

使用自帶VNET/VNET注入功能,可以配置:

這允許客戶遵守各種內部和beplay体育app下载地址外部安全策略和框架,同時維護服務的PaaS性質,從而為托管平台提供與默認部署模式相同的易用性。Beplay体育安卓版本

該特性今天已經公開預覽,在所有Azure Databricks區域都有完整的生產sla。一般的可用性很快就會出現。

試一試!

  • 如果您還沒有使用Azure Databricks,您可以通過以下內容進行嚐試這些方向

免費嚐試Databricks 開始

報名

Baidu
map