謝謝@Ohad·雷維夫。我將嚐試你的方法。
spark.executorEnv。PYTHONPATH環境隻適用於工人節點不是司機節點。在集群的初始化階段,它需要設置(在火花選項卡)。集群初始化後,磚覆蓋它即使你手工做spark.conf.set。
我更喜歡設置環境不是通過代碼科迪它打破了代碼的完整性。很難執行的時候很多人工作在同一集群。我希望有一個更好的辦法在集群磚屏幕,它允許用戶添加係統。默認後路徑;或允許人們在開發過程中可編輯的安裝(pip安裝- e)。
我檢查了工人節點到PYTHONPATH使用以下,以確保它被附加。
def getworkerenv ():
進口操作係統
返回(os.getenv (PYTHONPATH))
sc = spark.sparkContext
sc.parallelize ([1])。地圖(λx: getworkerenv ()) .collect ()