我們寫了一些python函數(在一個類中的方法)和打包輪庫。
在原有情況我們使用輪庫安裝在通用我們已經創建的集群。
它將正常工作。
將來的情形下(δ生活表)我們希望這個輪庫安裝δ活的管道執行的一部分,因為當集群DLT管道運行它創建自己的工作。
我們使用很多python函數要做金銀層之間的轉換。
因此我們希望輪庫(所有的UDF)安裝在集群DLT管道創建工作。
當我們執行% pip安裝<輪庫位置DBFS > DLT筆記本作為第一步,它似乎並不工作。
但是當我們有% pip安裝numpy它的工作原理。
其對我們重要的輪庫安裝在集群由DLT管道的工作。
我們遺漏了什麼東西?
謝謝
它說“這找不到whl文件”
在調查我們發現我們的圖書館坐落在nexus和集群應該設置環境變量。
當添加下麵DLT json管道設置,
" spark_env_vars ": {
:“PIP_INDEX_URL < URL為我們庫>”
},
它工作。
@Tomasz Bacewicz
感謝你的回複!
我們使用以下命令作為一個拳頭cmd DLT(細胞)的筆記本,
% pip安裝/ dbfs / dist / abnamro_acdpt_centraldatapoint-0.12.0.dev24-py3-none-any.whl
通知你,
當我們嚐試手動安裝相同的工作的集群DLT管道創建它正在安裝。
還在上麵運行相同的pip安裝命令所有目的集群的安裝。
隻有當它從DLT管道運行失敗。