Turbodbc是一個Python模塊,它使用ODBC接口訪問關係數據庫。
它依賴於libboost-all-dev,unixodbc-dev,python-dev需要按順序安裝的包。
您可以手動安裝這些工具,也可以使用初始化腳本自動安裝。
創建初始化腳本
在筆記本中運行這個示例腳本,在集群上創建初始化腳本。
%python dbutils.fs.mkdirs("dbfs:/") dbutils.fs.put("dbfs:/ /turbodbc_install.sh", "" #!/bin/bash #安裝依賴包sudo apt-get -y install libboost-all-dev unixodbc-dev python-dev pip install turbodbc==4.1.1 """,True)
記住初始化腳本的路徑。在配置集群時將需要它。
配置初始化腳本
按照文檔配置集群作用域的初始化腳本(AWS|Azure|GCP).
指定初始化腳本的路徑。使用與示例腳本中相同的路徑。
配置完init腳本後,需要重新啟動集群。