黑客很好但我怎麼遠程ssh連接到集群司機做真正的發展。我可以通過ssh連接到司機但似乎有一個不同的python沒有pyspark
使用回購!
回購可以調用一個函數在一個文件在同一個Github回購隻要啟用文件在管理麵板。
所以如果我有utils.py:
熊貓作為pd def clean_data導入():#葡萄酒數據加載數據= pd.read_csv (“/ dbfs / databricks-datasets /葡萄酒質量/ winequality-white。csv”, 9 = "; ")打印(數據)#刪除從列名數據空間。重命名(列=λx: x。替換(',' _ '),原地= True) '
我的筆記本可以調用上麵的:
進口跑龍套utils.clean_data ()