磚擴展Visual Studio代碼教程
磚擴展Visual Studio代碼允許您連接到遠程數據磚的工作區Visual Studio代碼集成開發環境(IDE)在當地的開發機器上運行。通過這些連接,您可以:
同步本地代碼Visual Studio中開發的代碼的代碼在你的遠程工作空間。
從Visual Studio代碼運行本地Python代碼文件在遠程磚集群的工作區。
運行本地Python代碼文件(
. py
)和Python, R, Scala, SQL筆記本(. py
,.ipynb
,r
,. scala
,. sql
)從Visual Studio代碼自動磚在遠程工作的工作區。
請注意
的磚擴展Visual Studio代碼支持運行R, Scala和SQL筆記本自動工作,但是不提供任何更深的Visual Studio代碼中支持這些語言。
本文演示了如何快速開始使用磚擴展Visual Studio代碼通過運行一個基本的Python代碼文件在遠程磚集群的工作區。
這個實踐教程假定:
你已經Visual Studio代碼1.69.1或更高版本的Python代碼的安裝和配置。看到設置Visual Studio代碼和開始使用Python在VS代碼。
Visual Studio代碼已經運行,當地項目打開。
你已經生成的目標數據磚的磚個人訪問令牌的工作區。看到磚個人訪問令牌認證。
你已經添加了你的磚個人作為一個訪問令牌
令牌
連同你的領域工作區實例URL例如,https://dbc-a1b2345c-d6e7.cloud.www.eheci.com
,作為一個主機
場的默認的
配置概要文件在您的本地.databrickscfg
文件。看到磚配置概要文件。
要完成本教程,請執行以下步驟:
安裝擴展:磚擴展Visual Studio代碼市場在Visual Studio代碼頁,點擊安裝。完成安裝,按照屏幕上的指令。
打開擴展:在側邊欄,點擊磚標誌。
開始配置擴展:在配置窗格中,單擊配置數據磚。
設置數據磚工作區:命令麵板,因為磚的主機,輸入您的工作區實例URL例如,
https://dbc-a1b2345c-d6e7.cloud.www.eheci.com
。然後按輸入。點擊進入默認值:驗證使用缺省概要文件。
設置數據磚集群:在配置窗格中,單擊集群,然後點擊齒輪(集群配置)圖標。
點擊進入您想要使用的集群。
啟動集群,如果尚未開始:在配置旁邊的窗格中,集群,點擊玩(啟動集群)圖標。
設置同步的目的地:配置窗格中,單擊同步的目的地,然後點擊齒輪(集群配置)圖標。
在命令麵板,點擊同步目的地名稱隨機生成的擴展。
創建一個基本的、本地Python代碼文件同步和運行:在側邊欄,點擊資源管理器標誌。
在主菜單中,點擊文件>新建文件。名字的文件demo.py並將其保存到項目根目錄。
將下麵的代碼添加到文件,然後保存它。這段代碼創建和顯示的內容基本PySpark DataFrame:
從pyspark.sql進口SparkSession從pyspark.sql.types進口*火花=SparkSession。構建器。getOrCreate()模式=StructType([StructField(“CustomerID”,IntegerType(),假),StructField(“FirstName”,StringType(),假),StructField(“姓”,StringType(),假)])數據=((1000年,“Mathijs”,“Oosterhout-Rijntjes”),(1001年,Joost的,“範Brunswijk”),(1002年,“斯坦”,“Bokenkamp”]]beplay体育app下载地址=火花。createDataFrame(數據,模式)beplay体育app下载地址。顯示()#輸出:## + - - - - - - - - - - - - - - - - - - - - - - - + - - - - - - - - - - - - - - - - - - - +# | CustomerID | FirstName LastName | |# + - - - - - - - - - - - - - - - - - - - - - - - + - - - - - - - - - - - - - - - - - - - +# | 1000 | Mathijs | Oosterhout-Rijntjes |# | 1001 | Joost van Brunswijk | |# | 1002 |斯坦| Bokenkamp |# + - - - - - - - - - - - - - - - - - - - - - - - + - - - - - - - - - - - - - - - - - - - +
在配置旁邊的窗格中,同步的目的地,點擊圓圈箭頭(開始同步)圖標。
在資源管理器視圖中,右鍵單擊
demo.py
文件,然後點擊上傳和磚上運行文件。出現在的輸出調試控製台窗格。