工作區庫
作為一個本地存儲庫工作區庫創建cluster-installed庫。工作區庫可能是您的組織創建的自定義代碼,也可能是一個特定版本的開源庫,您的組織已經標準化。
您必須安裝一個工作區圖書館集群上之前,可以用在筆記本或工作。
工作區圖書館共享文件夾可用於所有用戶在一個工作區,在用戶空間庫文件夾隻提供給用戶。
創建工作區庫
上傳一個Jar, Python雞蛋,或Python輪
請注意
安裝Python雞蛋是棄用和將被刪除在未來磚運行時版本。
在庫源按鈕列表中,選擇上傳。
選擇Jar,Python蛋,或Python Whl。
可選輸入一個庫名稱。
拖你的罐子,雞蛋、Whl到郵箱或點擊郵箱並導航到一個文件中。文件被上傳到
dbfs: / FileStore / jar
。點擊創建。圖書館狀態屏幕顯示。
(可選)在一個集群上安裝該庫。
引用一個上傳的jar, Python雞蛋,或Python輪
如果你已經上傳一個jar、雞蛋、或輪對象存儲一個工作區圖書館你可以參考它。
你可以選擇一個庫DBFS和一個存儲在gc。
選擇DBFS / gc在庫源按鈕列表中。
選擇Jar,Python蛋,或Python Whl。
可選輸入一個庫名稱。
指定DBFS或GCS路徑庫。
點擊創建。圖書館狀態屏幕顯示。
(可選)在一個集群上安裝該庫。
PyPI包
在庫源按鈕列表中,選擇PyPI。
輸入一個PyPI包名稱。安裝一個特定版本的庫,使用這種格式的庫:
<圖書館> = = <版本>
。例如,scikit-learn = = 0.19.1
。請注意
為工作磚建議您指定一個庫的版本以確保可再生的環境。如果指定的庫版本不完全,磚使用最新的匹配版本。這意味著不同的運行相同的作業可能使用不同的庫版本發布新版本。指定庫版本阻止新,打破改變圖書館打破你們的工作。
索引中的URL字段中,輸入PyPI指數URL,這是可選的。
點擊創建。圖書館狀態屏幕顯示。
(可選)在一個集群上安裝該庫。
Maven或火花包
在庫源按鈕列表中,選擇Maven。
指定一個Maven坐標。做下列之一:
在協調領域,進入圖書館的Maven協調安裝。Maven坐標形式
groupId: artifactId:版本
;例如,com.databricks: spark-avro_2.10:1.0.0
。如果你不知道確切的坐標,名稱並單擊進入圖書館搜索包。匹配的軟件包列表顯示。顯示一個包的詳細信息,單擊其名稱。你可以包的名字、組織和評級。您還可以編寫一個查詢篩選結果的搜索欄。結果自動刷新。
選擇Maven中央或火花包在左上角下拉列表。
可選擇的包版本發布列。
點擊+選擇旁邊一個包。協調字段填寫與所選包和版本。
在存儲庫中,可以選擇輸入一個Maven存儲庫URL。
請注意
內部不支持Maven存儲庫。
在除外責任字段中,選擇提供
groupId
和artifactId
你想排除的依賴性;例如,log4j: log4j
。點擊創建。圖書館狀態屏幕顯示。
(可選)在一個集群上安裝該庫。
凹口包
在庫源按鈕列表中,選擇凹口。
在Package字段中,輸入包的名稱。
在存儲庫中,有選擇地進入凹口存儲庫URL。
點擊創建。圖書館細節屏幕顯示。
(可選)在一個集群上安裝該庫。
請注意
凹口包隻能在磚運行時9.0及以上。
請注意
凹口鏡服務庫的最新版本。作為一個結果,你可能最終與不同版本的R包如果你把圖書館在不同的時間不同的集群。學習如何管理和修複R包版本在磚上,看到的知識庫。