火車一個機器學習模型的Python數據統一目錄
預覽
聯合目錄是在公共預覽。參與預覽,請聯係您的磚的代表。
統一目錄允許您應用細粒度安全表和安全地訪問它們從任何語言,同時與其他機器學習組件交互無縫磚。本文展示了如何使用Python培訓統一目錄中使用數據的機器學習模型。
需求
必須在你的磚賬戶保費計劃。
你一定是一個帳戶管理或metastore管理metastore你用來訓練模型。
創建一個磚機器學習的集群
按照以下步驟創建一個單用戶集群磚機器學習的,可以在統一目錄訪問數據。
創建一個磚機器學習的集群可以訪問統一目錄:
登錄到工作區工作管理。
在數據科學與工程或磚機器學習的角色,點擊計算。
點擊創建集群。
輸入一個名稱為集群。
為磚的運行時版本的:
點擊毫升。
選擇10.3毫升(Scala 2.12火花3.2.1之上)或更高版本,或者10.3毫升(GPU, Scala 2.12,火花3.2.1)或更高版本。
點擊高級選項。集安全模式來用戶隔離或單用戶。要運行Python代碼,您必須使用單用戶。
可以由多個用戶共享的用戶隔離集群,但僅支持SQL工作負載。安裝集群一些高級特性,比如圖書館,init腳本和殘疾人DBFS保險絲山也確保集群用戶之間的安全隔離。
使用這些先進的集群特性或語言或運行工作負載使用Python, Scala和R,單用戶設置集群模式。單用戶集群也可以運行SQL工作負載。集群可以隻使用一個用戶(默認情況下集群的所有者);其他用戶無法連接到集群。自動化工作應該在這種模式下運行,並且工作的主人應該是集群的主人。在這種模式下,查看安全不能執行。用戶從一個視圖選擇執行的權限。
更多的信息特性在每個安全模式下,明白了集群安全模式。
點擊創建集群。