取消
顯示的結果
而不是尋找
你的意思是:

有沒有辦法在Azure比較數據在一個領域?

CBull
新的貢獻者三世

有辦法比較時間戳在個別ID字段/列?例如,如果我有兩個記錄ID和時間戳的5分鍾內互相....我隻是想保持最新。但是,舉例來說,如果他們相隔一個小時我將繼續記錄。

4回複4

馬爾卡
重視貢獻二世

窗口函數可以是你所需要的東西。

從pyspark。sql導入函數F df.groupBy (F。窗口(“event_time”、“5分鍾”))

CBull
新的貢獻者三世

所以,這是做這樣的嗎?

選擇

r.patientmedicalrecordnumber,

r。callreceiveddatetime為日期

從表r

左外連接表p

在r。pageid = p.pageid

在p。pagetype = 6

和演員(r。callreceiveddatetime日期)=當前日期()- 1

df。groupBy (r。窗口(“event_time”、“5分鍾”))

ORDER BY r.callreceiveddatetime

馬爾卡
重視貢獻二世

因為你正試圖用SQL,我希望別人能給你正確的答案。上麵的例子是pyspark。你可以檢查SQL synax磚的文檔

Kaniz
社區經理
社區經理

嗨@Cory布拉德,我們一直沒有收到你最後的回應@Merca Ovnerud,我檢查是否你有一個決議。

如果你有任何解決方案,請與社區分享,因為它可以幫助別人。否則,我們將與更多的細節和試圖幫助回應。

同時,請別忘了點擊“選擇最佳”按鈕時提供的信息幫助解決你的問題。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map