02-03-202305:02我
加速查詢的最佳實踐是什麼看起來像下麵的哪一個?
贏得= Window.partitionBy (key1, key2) .orderBy df(“時間戳”)。選擇(“時間戳”,(F.col (col1) - F.lag (col1) .over(贏得)).alias (col1_diff))
我嚐試使用優化表ZORDER key1, key2但它不工作。
有很多的洗牌。數據分區按日期生成的列的時間戳。
03-07-202321點
@Hanan Shteingart:與窗函數優化查詢,你應該試著多-過濾數據,減少窗口中使用的列數,優化窗口分區和訂購,如果需要增加集群的大小。請嚐試以下選項
04-05-202311:55
嗨@Hanan Shteingart
謝謝你發布你的問題在我們的社區!我們很高興幫助你。
幫助我們為您提供最準確的信息,請您花一些時間來回顧反應和選擇一個最好的回答了你的問題嗎?
這也將有助於其他社區成員可能也有類似的問題在未來。謝謝你的參與,讓我們知道如果你需要任何進一步的援助!
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。