轉換為三角洲湖

轉換δSQL命令執行Parquet和Iceberg表到Delta Lake表的一次性轉換。對於拚花或冰山表增量轉換到三角洲湖,請參閱增量克隆拚花和冰山表三角洲湖

Unity Catalog支持轉換δ用於存儲在Unity Catalog管理的外部位置的Parquet和Iceberg表的SQL命令。

您可以將現有的Parquet數據文件配置為Unity Catalog中的外部表,然後將它們轉換為Delta Lake以解鎖Databricks Lakehouse的所有功能。

有關技術文檔,請參見轉換為

將外部位置的Parquet或Iceberg文件目錄轉換為Delta Lake

請注意

  • 轉換冰山表是可行的公共預覽

  • Databricks Runtime 10.4及以上版本支持轉換冰山表。

  • 不支持轉換冰山亞礦表。

  • 轉換已經曆過的冰山表分區進化不支持。

  • 不支持轉換經曆過更新、刪除或合並的Iceberg讀時合並表。

隻要對存儲位置具有寫訪問權,就可以將Parquet數據文件目錄轉換為Delta Lake表。

轉換δ拚花gcs//我的-/拚花-數據轉換δ冰山gcs//我的-/冰山-數據

然後,您可以將這些文件注冊為Hive metastore中的表。

請注意

對於Databricks Runtime 11.2及以上版本,轉換δ自動推斷注冊到metastore的表的分區信息,從而消除手動指定分區的需求。

將托管表和外部表轉換為Unity Catalog上的Delta Lake

Unity Catalog對外部表支持多種格式,但對托管表隻支持Delta Lake。要將托管Parquet表直接轉換為托管Unity Catalog Delta Lake表,請參見將一個表升級為Unity Catalog管理表

要將外部拚花桌升級到Unity目錄,請參見將一個外部表升級到Unity Catalog

一旦你向Unity Catalog注冊了一個外部Parquet表,你就可以將它轉換為一個外部Delta Lake表。注意,如果拚花桌是分區的,則必須提供分區信息。

轉換δcatalog_namedatabase_nametable_name轉換δcatalog_namedatabase_nametable_name分區通過date_updated日期);