Re:δ表加速度對group by鍵c…-磚- 10077

chanansh · ‎02-03-2023

加速查詢的最佳實踐是什麼看起來像下麵的哪一個?

贏得= Window.partitionBy (key1, key2) .orderBy df(“時間戳”)。選擇(“時間戳”,(F.col (col1) - F.lag (col1) .over(贏得)).alias (col1_diff))

我嚐試使用優化表ZORDER key1, key2但它不工作。

有很多的洗牌。數據分區按日期生成的列的時間戳。

匿名 · ‎03-07-2023

@Hanan Shteingart:與窗函數優化查詢,你應該試著多-過濾數據,減少窗口中使用的列數,優化窗口分區和訂購,如果需要增加集群的大小。請嚐試以下選項

Vidula_Khanna · ‎04-05-2023

嗨@Hanan Shteingart

謝謝你發布你的問題在我們的社區!我們很高興幫助你。

幫助我們為您提供最準確的信息,請您花一些時間來回顧反應和選擇一個最好的回答了你的問題嗎?

這也將有助於其他社區成員可能也有類似的問題在未來。謝謝你的參與,讓我們知道如果你需要任何進一步的援助!

磚