12-08-202205:08我
我有很多表有80%的列滿是null。我理解SQL服務器提供了一種方法來處理這些類型的數據在數據定義的表(稀疏的關鍵字)。datalake提供類似的東西嗎?
12-08-202206:17我
datalake本身不是,但你使用的文件格式來存儲數據。
遠東鑲木地板使用列壓縮,所以稀疏數據壓縮相當不錯。
csv另一方麵:徹頭徹尾的災難
12-12-2022上午12:15
除非你壓縮整個CSV,也應該是一個可行的方法。
說,δ/拚花通常會是更好的選擇,每一列壓縮。
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。