在磚三角洲緩存是一個邊緣的特性可用。這意味著它不是在OSS火花。火花緩存也可以在數據磚。
在高級別上,三角洲緩存是將數據存儲在磁盤執行人的重複訪問的數據。火花緩存是將數據存儲在內存或磁盤或重複訪問。緩存機製是不同的方式驅逐和刷新完成。
這裏提供一個比較:
https://docs.www.eheci.com/delta/optimizations/delta-cache.html delta-and-apache-spark-caching
三角洲緩存加速數據讀取通過創建遠程文件的副本節點的本地存儲中間數據格式使用快。數據緩存自動當一個文件從遠程獲取。連續讀取相同的數據然後在本地執行,從而顯著提高閱讀速度。
這裏是每個類型的特征: