取消
顯示的結果
而不是尋找
你的意思是:

我應該使用在δZ順序表每次運行優化?

User16826992666
價值貢獻

想知道如果它總是有意義或者在一些情況下你可能隻想優化運行

1接受解決方案

接受的解決方案

Srikanth_Gupta_
價值貢獻

優化它的好主意在每個批處理作業,以避免任何小文件情況,Z順序是可選的,可以應用在一些非分區列經常用於讀取操作

ZORDER由- >

把同一組文件中列信息。使用Co-locality三角洲湖data-skipping算法極大地減少了需要讀取的數據量。您可以指定多個列ZORDER的逗號分隔列表。然而,當地的有效性下降與每個額外的列。z值是不是冪等但旨在成為一個增量操作。

在原帖子查看解決方案

1回複1

Srikanth_Gupta_
價值貢獻

優化它的好主意在每個批處理作業,以避免任何小文件情況,Z順序是可選的,可以應用在一些非分區列經常用於讀取操作

ZORDER由- >

把同一組文件中列信息。使用Co-locality三角洲湖data-skipping算法極大地減少了需要讀取的數據量。您可以指定多個列ZORDER的逗號分隔列表。然而,當地的有效性下降與每個額外的列。z值是不是冪等但旨在成為一個增量操作。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map