出於某種原因,我和dbconnect失敗沒能解決問題。我是連接到一個企業服務器。我收到了下麵的錯誤(我相信)現在都解決了。
我定義了PYSPARK_DRIVER_PYTHON和PYSPARK_PYTHON變量到正確的位置。然後我在線下載hadoop的二進製文件,存儲的目錄在我的環境中,HADOOP_HOME變量設置為目錄。我把這些路徑使用< conda env配置var設置my_var =值>
現在,我得到以下輸出。我不能告訴如果還有一些環境變化我需要或者問題是“無效的碎片地址”。我認為是前者,因為碎片地址我輸入的是正確的。任何幫助表示讚賞