11-22-201501:03點
假設我有以下:
val dataset3 = dataset2.map (.....) 1)
1)如果你轉換在dataset2然後你必須堅持它並將其傳遞給dataset3 unpersist前或不呢?
2)我試著找出何時堅持和unpersist抽樣。每次創建新的抽樣,我一定要堅持嗎?
3)為了一個unpersist發生,行動必須遵循? (e。x otherrdd.count)
謝謝
11-24-201510:10點
能夠很好的證明:http://spark.apache.org/docs/latest/programming-guide.html rdd-persistence
11-04-2019十一14點
這並不回答問的任何問題。這個問題是關於unpersisting一個數據幀。相關文檔隻說,這是可以做到的,但不給任何提示當它應該做的。我擔心的是,unpersisting過早會導致零緩存的好處。
我假設你應該等到去年力評估,但它不是記錄,很難推斷鑒於緩存/ unpersist變異。
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。