03-28-202204:30點
我想檢查是否存在一定的數據在多個地點。
這是我的表是什麼樣子:
我檢查是否相同的數據在兩個地點。我們的想法是,這個數據應該存在於兩個位置,隻計算一次,如果這是在兩個標記。最終的結果應該是這樣的:
謝謝提前
03-29-202201:48我
我認為這個例子太短,理解不完全(在源表中,一切都是不同的,在目的地,表計數有相當數量),請更新兩個表結果將基於源的一個計數。
數據可以超過2的位置嗎?
我敢打賭的方法是創建一個拷貝dataframe數據,然後將它們連接在一起。在下一步中,過濾器,組和計數。
加入的使用取決於所需的邏輯。例如,它可以加入,內連接,也或者intersectAll相交。
在原帖子查看解決方案
03-28-202211:48點
你的意思是像一個內部加入dataframes 2日嗎?
03-29-202206:40點
它可能是。這就是我一直在做,但它並沒有為我工作。所以我尋找其他選項可能更有利於重複檢驗多個位置。然而,我仍然開放的建議如果我能使它成功。
03-29-202206:50點
這是一個更準確的照片我的表:
是的,數據可以有超過2的位置。有重複的點共享相同的位置。
你能澄清你意思更新計算基於源?我試圖實現第二個表,隻計算點如果他們去兩個地方,如果有重複,它隻計算數據點一次而不是兩次
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。