取消
顯示的結果
而不是尋找
你的意思是:

緩存表/視圖創建或替換像視圖嗎?

fury88
新的貢獻者二世

我想要緩存數據/查詢,我們通常有臨時視圖,取代基於動態python代碼運行時。我想知道的是緩存表會覆蓋每次運行嗎?它是足夠聰明來識別表已經緩存和跳過嗎?試圖避免這個運行每次如果它存在。

1回複1

UmaMahesh1
尊敬的貢獻者三世

嗨@Matt憤怒

是的……我猜緩存覆蓋每次運行它,因為對我來說,花了近100萬條記錄相同數量的時間被緩存。

然而,您可以檢查表是否緩存或不使用.storageLevel方法。

例如我有一個名為表的表。緩存之前,如果我運行下麵,

spark.table(“表1”)。storageLevel——輸出將storageLevel(假的,假的,假的,假的,1)

緩存表名;——現在我緩存表

spark.table(“表1”)。storageLevel——輸出將storageLevel(真的,真的,假的,真的,1)

你可以使用各自的storagelevel像個人標誌

spark.table .storageLevel.useMemory(“表1”)

spark.table .storageLevel.useDisk(“表1”)

spark.table .storageLevel(“表1”)。useOffHeap等等……

更多的存儲水平,看看https://sparkbyexamples.com/spark/spark-persistence-storage-levels/

歡呼聲……

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map