火花性能調優的過程是指記錄內存調整設置,核心,和實例使用的係統。這個過程保證火花有完美的表現,同時也防止阻塞引發的資源。
為了,減少內存使用您可能需要存儲序列化形式的火花抽樣。數據序列化也決定了一個良好的網絡性能。你將能夠獲得好的結果引發的性能:
火花支持兩種序列化庫,如下:
雖然優化內存使用,突出的有三個方麵:
減少內存消耗的一個選擇是遠離java特性可能開銷。這裏有幾個方法:
為了避免相關的大型“生產”之前存儲的抽樣程序,java將解散舊對象為了創造新的空間。然而,通過使用更少的對象數據結構特性大大降低成本。其中一個例子就是就業int數組而不是一個鏈表。或者,您可以使用對象的序列化形式,所以你會為每個抽樣分區隻有一個單一的對象。
一個高效的內存使用良好的性能是至關重要的。火花使用內存主要用於存儲和執行。存儲內存用於緩存數據,稍後會被重用。另一方麵,執行內存用於計算打亂排序,連接,和聚合。內存爭用Apache火花帶來了三個挑戰:
而不是提前避免靜態保留的內存,你可以處理內存爭用強迫成員出現泄漏。