Trasform SQL遊標使用Pyspark磚-磚- 9499

elgeo · ‎02-13-2023

我們有一個光標在DB2在每個循環讀取數據從表2。每個循環結束時,插入到目標表的數據後,我們更新這兩個表中的記錄與每個循環之前移動到下一個循環。一個指示性的例子是以下:

獲取CUR1 V_A1, V_A2、V_C1 V_C3, V_M1 V_M2

選擇從TABLE_1 V_M1 A1 = V_A1

從TABLE_2選擇V_M2 C1 = V_C1的地方

如果.....那麼其他V_B1 = V_M1-V_M2 ....

插入目標……值(V_A1, V_A2,…)

更新TABLE_1組V_M1 = V_M1 - V_B1

更新TABLE_2組V_M2 = V_M2 - V_B1

獲取CUR1 V_A1, V_A2、V_C1 V_C3, V_M1 V_M2

結束時

關閉CUR1

注意,A1, C1整個數據並不是唯一的。

請建議使用Pyspark變換方法嗎?性能也很重要,因為我們談論大量數據。我看到抽樣是不可變的,以防我們RDD-map選項。

提前謝謝你

匿名 · ‎03-07-2023

@ELENI GEORGOUSI:

希望這可以給你一個框架如何思考和遙控器。

Vidula_Khanna · ‎04-10-2023

嗨@ELENI GEORGOUSI

謝謝你發布你的問題在我們的社區!我們很高興幫助你。

幫助我們為您提供最準確的信息,請您花一些時間來回顧反應和選擇一個最好的回答了你的問題嗎?

這也將有助於其他社區成員可能也有類似的問題在未來。謝謝你的參與,讓我們知道如果你需要任何進一步的援助!