用dbx同步本地文件與遠程實時工作區
提示
本文描述了如何使用dbx同步
本身。的磚擴展Visual Studio代碼已包括功能類似dbx同步
代碼集成到Visual Studio IDE。
另外,請注意,dbx同步
可以從本地同步文件更改開發機器DBFS、空間位置和磚回購在你的磚工作區。< vscode-ext >支持同步文件更改隻工作空間用戶(/用戶
)文件和數據磚回購(/回購
)。
請注意
本文將介紹dbx
磚實驗室,是按原樣提供,不支持通過客戶技術支持渠道磚。問題和特性請求可以通過溝通問題頁麵的databrickslabs / dbx在GitHub回購。
您可以執行實時同步的變化與相應的文件在您的本地開發機器磚工作區使用的文件dbx通過磚實驗室。這些可以在工作區文件DBFS或在磚回購。
實時文件同步dbx
(也稱為dbx同步
)對代碼快速發展的情況下是很有用的。例如,您可以使用當地的集成開發環境(IDE)生產力特性,比如語法高亮顯示、智能代碼補全,代碼產品毛羽,測試和調試。然後您可以立即進入工作區和運行您的代碼更新。
dbx同步
開發工作流程
有兩個開發工作流dbx同步
,一個DBFS和另一個磚回購。
典型的開發流程dbx同步
和DBFS是:
確定一個本地目錄,其中包含您想要同步的文件DBFS。
確定你想要的路徑DBFS同步(或者讓你當地的目錄
dbx同步
為你創建一個默認DBFS路徑)。運行
dbx同步dbfs
同步你的本地目錄DBFS路徑。dbx同步
開始看您的本地目錄的任何文件更改。根據需要更改文件在您的本地目錄。
dbx同步
這些變化適用於相應的實時DBFS路徑中的文件。
典型的開發流程dbx同步
和磚回購是:
創建一個存儲庫和一個Git提供者磚回購協議的支持,如果你已經沒有可用的存儲庫。
克隆回購到磚工作區中。
克隆回購到本地開發的機器。
運行
dbx同步回購
把當地的克隆回購和工作區克隆回購。dbx同步
開始看您的本地目錄的任何文件更改。更改文件在您的本地克隆回購。
dbx同步
這些變化適用於相應的文件實時數據磚回購。定期推送更新文件從您的工作區中克隆的回購Git提供者,因此回購保持最新Git提供者。
重要的
dbx同步
隻執行單向的、實時的同步文件更改從你當地的開發機遠程工作區。因此,磚不建議你開始改變磚工作區所監視的文件dbx同步
。如果你必須這樣workspace-initiated文件更改,那麼您還必須做到以下幾點:
文件DBFS變化,使相應的手動修改本地文件。
磚回購的文件更改,把文件從您的工作空間變為你的Git提供者。本地開發機器上,拉出這些文件從你的Git提供者。
需求
如果你想使用dbx同步
磚回購,磚工作區必須符合下列要求:
一個克隆與Git存儲庫的提供者,而不是必需的,是建議。
本地開發機器上,您必須安裝以下:
Python版本3.8或更高版本。檢查是否安裝Python,檢查你的安裝Python版本,運行
python——版本
在你的終端或PowerShell。python的版本
請注意
一些設施
python
你可能需要使用嗎python3
而不是python
。如果是這樣,替代python
與python3
在這篇文章。皮普。檢查是否
皮普
安裝,檢查你的安裝嗎皮普
版本,運行皮普——版本
或python- m皮普——版本
。皮普,版本#還是……python - m pip -版本
請注意
一些設施
皮普
你可能需要使用嗎pip3
而不是皮普
。如果是這樣,替代皮普
與pip3
在這篇文章。dbx0.8.0或以上版本。檢查是否
dbx
安裝,檢查你的安裝嗎dbx
版本,運行dbx——版本
。安裝dbx
從Python包指數(PyPI)運行皮普安裝dbx
或python- m皮普安裝dbx
。(dbx
包括dbx同步。)#檢查dbx是否安裝,並檢查它的版本。dbx——版本#安裝dbx。pip安裝dbx#還是……python - m pip安裝dbx
的磚CLI或低於0.17版本,設置身份驗證。遺留數據磚CLI(磚CLI的0.17版)是自動安裝時安裝
dbx
。這種身份驗證可以設置本地開發機器上的一個或兩個以下位置:在
DATABRICKS_HOST
和DATABRICKS_TOKEN
環境變量(與遺留數據磚CLI 0.8.0版開始)。在一個磚配置概要文件在你的
.databrickscfg
文件。
dbx
分別在這兩個位置查找身份驗證憑證。dbx
隻使用它找到的第一組匹配的憑證。請注意
如果你使用一個
.databrickscfg
文件,dbx同步
在這個文件中查找一個配置概要文件命名默認的
默認情況下。要指定一個不同的配置文件,可以使用——簡介
運行時選項dbx同步
命令,在本文的後麵。dbx
不支持使用嗎. netrc申請認證。如果你想使用
dbx同步
磚回購協議,本地Git克隆存儲庫的提供者,而不是必需的,是建議。執行當地的克隆,谘詢你的Git提供者的文檔。
使用DBFSdbx同步
從終端或PowerShell本地開發機器上,改變目錄包含文件你想同步DBFS磚工作區。
運行dbx同步命令來同步您的本地目錄在您的工作區DBFS,如下。(不要忘記點(
。
)在最後,這代表當前目錄。)dbx dbfs——源同步。
提示
指定一個不同的源目錄,替換點(
。
一條不同的道路。請注意
如果錯誤
錯誤:沒有這樣的命令“同步”
看來,你的安裝dbx
可能是過時了。為了解決這個問題,運行皮普安裝——升級dbx = = <版本>
或python- m皮普安裝——升級dbx = =版本
,在那裏<版本>
是最新版本的嗎dbx
。這個版本號上可以找到PyPI dbx的網頁。pip安裝,升級dbx= =<版本>#還是……python - m pip安裝,升級dbx= =版本
dbx同步
開始同步文件在你當前的本地目錄與文件在以下DBFS路徑在工作區中。dbx同步
證實了這種通過印刷目標基地路徑
其次是DBFS路徑,例如:/ tmp /用戶/ < your-Databricks-username > / < local-directory-name >
提示
指定一個不同的用戶名或DBFS路徑,指定
——用戶
和——桌子
當你運行選項,分別dbx同步
。如有需要,修改你的本地文件。
重要的
你必須保持你的終端或PowerShell開放
dbx同步
繼續同步。如果你閉上你的終端或PowerShell,dbx同步
停止看文件和停止同步變化。恢複文件同步變化,重複這個過程從一開始。根據需要,驗證您的文件更改在前麵的路徑在DBFS工作區。
使用磚回購dbx同步
從終端或PowerShell本地開發機器上,改變根目錄,其中包含與Git存儲庫的克隆提供者。
磚的工作區,確定磚回購的名稱,你想同步本地克隆回購。你可以找到這個回購名稱點擊回購在您的工作空間的側邊欄。
本地開發機器上運行dbx同步命令來同步您的本地克隆存儲庫工作區中的磚回購協議如下,更換
< your-repo-name >
磚回購協議的回購的名稱。(不要忘記點(。
)在最後,這代表當前目錄。)dbx回購- d < your-repo-name >——源同步。
提示
指定一個不同的源目錄,替換點(
。
一條不同的道路。請注意
如果錯誤
錯誤:沒有這樣的命令“同步”
看來,你的安裝dbx
可能是過時了。為了解決這個問題,運行皮普安裝——升級dbx = = <版本>
或python- m皮普安裝——升級dbx = =版本
,在那裏<版本>
是最新版本的嗎dbx
。這個版本號上可以找到PyPI dbx的網頁。pip安裝,升級dbx= =<版本>#還是……python - m pip安裝,升級dbx= =版本
dbx同步
開始同步文件在您的本地克隆存儲庫工作區中的文件數據磚回購。dbx同步
證實了這種通過印刷目標基地路徑
其次是磚回購的路徑,例如:/回購/ < your-Databricks-username > / < your-repo-name >
提示
指定一個不同的用戶名或回購名稱,指定
——用戶
和——dest-repo
當你運行選項,分別dbx同步
。如有需要,修改你的本地文件。
重要的
你必須保持你的終端或PowerShell開放
dbx同步
繼續同步。如果你閉上你的終端或PowerShell,dbx同步
停止看文件和停止同步變化。恢複文件同步變化,重複這個過程從一開始。根據需要,驗證文件工作區中的磚回購的變化。
額外的資源
databrickslabs / dbx在GitHub庫