輸入數據:
問題解決:
輸出:
好奇有人會使用什麼技術去解決這個使用磚。
我的新磚,隻有最近收到一個數據工程助理證書。
有額外的細節問題我可以進入如果進行進一步的討論。道歉如果這個似乎不適合討論這個論壇。
我過去處理類似的事情。
訂單係統有秩序應該是匹配的項目,對相應的產品在另一個係統,作為主人和發票處理。
至於與磚碼字考慮這樣做,看看你是否可以得到需要的行對相同的工人加入,這樣你就可以避免shuffeling在最初閱讀?
另一件事要注意這樣的問題是如果你有多個候選匹配規則,但在匹配什麼取決於如果已經匹配的記錄。
在這種情況下,你可能有某種reccursive問題在你的手,可以繼續生產更多的比賽,當你多次運行相同的操作在同一數據集。
至於如何解決這一問題,至少試著給所有行獨特的鍵來減少查詢的complexitiy / cognetive開銷在處理業務規則。
也考慮做一個鏈接/結表和存儲匹配的密鑰對與時間戳等有用的元數據,匹配規則使用等鑰匙丟失的表會自動elligible未來匹配和它可以用來加入表再次一起在其他上下文沒有複製的邏輯。