取消
顯示的結果
而不是尋找
你的意思是:

什麼“確定DBIO文件碎片的位置……”的意思是,我怎麼加速?

ajaypanday6781
尊敬的貢獻者二世

確定的位置DBIO文件片段。這個操作可能要花費一些時間。

這是什麼意思,我怎麼阻止它每次都必須執行這個apparently-expensive操作嗎?這種情況即使所有底層表三角洲表。

1接受解決方案

接受的解決方案

LandanG
尊敬的貢獻者
尊敬的貢獻者

嘿,@Ajay Pandey,

相關信息是δ緩存,基本上如果集群不斷擴大或偶爾你可能會失去三角洲緩存碎片。確定DBIO文件碎片的位置操作確定哪些執行人文件緩存。

這是可以通過努力幫助一個更新的DBR如11.3或12. x。你也可以嚐試關閉緩存通過設置以下配置在筆記本上和觀察的行為:

spark.conf.set (“spark.databricks.io.cache。啟用”、“假”)

你也可以嚐試優化表(年代)

% sql優化(表名)

在原帖子查看解決方案

6個回答6

LandanG
尊敬的貢獻者
尊敬的貢獻者

嘿,@Ajay Pandey,

相關信息是δ緩存,基本上如果集群不斷擴大或偶爾你可能會失去三角洲緩存碎片。確定DBIO文件碎片的位置操作確定哪些執行人文件緩存。

這是可以通過努力幫助一個更新的DBR如11.3或12. x。你也可以嚐試關閉緩存通過設置以下配置在筆記本上和觀察的行為:

spark.conf.set (“spark.databricks.io.cache。啟用”、“假”)

你也可以嚐試優化表(年代)

% sql優化(表名)

ajaypanday6781
尊敬的貢獻者二世

謝謝

AdrianLobacz
貢獻者

這是一個三角洲緩存信息。它決定了執行人的緩存,緩存路由任務最佳位置。優化你的表更頻繁地減少將使這個文件更好

你可以嚐試:

% sql優化(表名)

ajaypanday6781
尊敬的貢獻者二世

謝謝

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map