你好,
我的問題是——會發生什麼動作執行後的初始抽樣。它消失還是停留在記憶還是需要顯式緩存()如果我們想再次使用它。
例如:如果我執行這個序列:
df_output = df_input.filter (…) - - > transformation_1
- - > Action_1 df_output.count ()
df_final = df_output.filter (…) - - > Transformation_2
- - > Action_2 df_final.count ()
在執行Action_2, Transformation_1 & 2都再次執行或隻Transformation_2(如果這是情況是Transformation_1存儲同時)的結果嗎?