03-15-202202:31點
有辦法比較時間戳在個別ID字段/列?例如,如果我有兩個記錄ID和時間戳的5分鍾內互相....我隻是想保持最新。但是,舉例來說,如果他們相隔一個小時我將繼續記錄。
03-23-202251點
窗口函數可以是你所需要的東西。
從pyspark。sql導入函數F df.groupBy (F。窗口(“event_time”、“5分鍾”))
03-23-202201:12點
所以,這是做這樣的嗎?
選擇
r.patientmedicalrecordnumber,
r。callreceiveddatetime為日期
從表r
左外連接表p
在r。pageid = p.pageid
在p。pagetype = 6
和演員(r。callreceiveddatetime日期)=當前日期()- 1
df。groupBy (r。窗口(“event_time”、“5分鍾”))
ORDER BY r.callreceiveddatetime
03-23-2022喂飼點
因為你正試圖用SQL,我希望別人能給你正確的答案。上麵的例子是pyspark。你可以檢查SQL synax磚的文檔
07-12-202205:29我
嗨@Cory布拉德,我們一直沒有收到你最後的回應@Merca Ovnerud,我檢查是否你有一個決議。
如果你有任何解決方案,請與社區分享,因為它可以幫助別人。否則,我們將與更多的細節和試圖幫助回應。
同時,請別忘了點擊“選擇最佳”按鈕時提供的信息幫助解決你的問題。
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。