三角洲表屬性引用
湖儲備δ表屬性入手三角洲。
。這些屬性可能有特定的含義,並影響行為時,這些屬性集。
表屬性和SparkSession交互屬性怎麼樣?
δ表屬性設置每個表。如果一個屬性設置在一個表上,那麼這是緊隨其後的是默認的設置。
有些表屬性關聯SparkSession總是優先於表屬性的配置。一些例子包括spark.databricks.delta.autoCompact.enabled
和spark.databricks.delta.optimizeWrite.enabled
汽車壓實和優化配置,打開寫SparkSession層麵而不是表級別。磚建議使用table-scoped配置對於大多數工作負載。
對每一個增量表屬性可以設置一個默認值為新表使用SparkSession配置,覆蓋內置的默認。這個設置隻影響到新表,不覆蓋或替換現有表的屬性設置。中使用的前綴SparkSession不同屬性中使用的配置表,如下表所示:
三角洲湖相依 |
SparkSession相依 |
---|---|
|
|
例如,設置delta.appendOnly=真正的
財產所有新三角洲湖表中創建一個會話,設置如下:
集火花。磚。δ。屬性。違約。appendOnly=真正的
修改現有表的表屬性,使用設置TBLPROPERTIES。
三角洲表屬性
可用三角洲表屬性包括以下:
財產 |
---|
看到三角洲表屬性引用。 數據類型: 默認值: |
看到汽車壓實對磚三角洲湖。 數據類型: 默認值:(一) |
看到優化為三角洲湖磚。 數據類型: 默認值:(一) |
看到在檢查站管理列級統計。 數據類型: 默認值: |
看到在檢查站管理列級統計。 數據類型: 默認值:(一) |
是否支持增量表列和列映射相應的拚花列使用不同的名稱。 數據類型: 默認值: |
列數為三角洲湖為跳過數據收集統計信息。的值 數據類型: 默認值: |
最短的時間前三角洲湖保持邏輯刪除數據文件刪除。這是為了防止失敗後在陳舊的讀者緊湊排列或分區覆蓋。 這個值應該足夠大,以確保:
看到配置數據保留時間旅行。 數據類型: 默認值: |
看到使改變數據提要。 數據類型: 默認值: |
一個事務的程度必須隔絕的修改由並發事務。 有效的值 看到隔離級別和寫衝突磚。 數據類型: 默認值: |
三角洲的曆史表保存多長時間。 每次寫的一個檢查站,三角洲湖自動清理日誌條目超過保留時間間隔。如果將此屬性設置為一個足夠大的價值,許多日誌條目被保留。這應該不會影響性能,操作日誌是常數時間。曆史上的操作是平行但日誌大小增加將變得更加昂貴。 看到配置數據保留時間旅行。 數據類型: 默認值: |
最低要求協議版本為讀者,讓讀者閱讀從δ表。 數據類型: 默認值: |
作家的最低要求協議版本為一個作家可以寫這個δ表。 數據類型: 默認值: |
數據類型: 默認值: |
當 數據類型: 默認值: |
最短的時間內新快照將保留事務標識符(例如, 數據類型: 默認值:(一) |
目標文件大小的字節或更高的單位文件調優。例如, 數據類型: 默認值:(一) |
數據類型: 默認值:(一) |