取消
顯示的結果
而不是尋找
你的意思是:

如何優化稀疏數據存儲數據湖?

DB_developer
新的貢獻者三世

我有很多表有80%的列滿是null。我理解SQL服務器提供了一種方法來處理這些類型的數據在數據定義的表(稀疏的關鍵字)。datalake提供類似的東西嗎?

2回答2

werners1
尊敬的貢獻者三世

datalake本身不是,但你使用的文件格式來存儲數據。

遠東鑲木地板使用列壓縮,所以稀疏數據壓縮相當不錯。

csv另一方麵:徹頭徹尾的災難

Hakon_Amdal
新的貢獻者三世

除非你壓縮整個CSV,也應該是一個可行的方法。

說,δ/拚花通常會是更好的選擇,每一列壓縮。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map