DF
問日期(yyyy-mm-dd)
q1 2017-10-01
q2 2017-10-03
q1 2017-10-09
第三季度2017-10-06
q2 2017-10-01
q1 2017-10-13
Q1 2017-10-02
第三季度2017-10-21
第四季度2017-10-17
Q5 2017-10-20
第四季度2017-10-31
Q2 2017-10-27
Q5 2017-10-01
Dataframe:
問計數(第1周)計數(星期2)計數(周3)計數(周4)Avg(計數)數的標準差
Q1 2 2 0 0適用一樣適用
Q2 2 0 0 1”“
第三季1 0 1 0 "
第四季度0 0 1 1
Q5 1 0 1 0 "
它應該是一種應用正確的轉換:集
在這個階段的數據是這樣的:
但真正的關鍵是要平,需要的就是集團weekOfYear然後選擇與每一列的總和(S, M T W T F、S),就會看起來像這樣:
df.groupBy (“weekOfYear”) .sum(“太陽”、“我的”,“星期二”、“結婚”、“清華”、“星期五”,“坐”)
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - -更新
解決方案包括總和(. .)如果你有數字數據工作。然而,如果您有非數值數據,我們需要一個稍微不同的方法。在這種情況下,我們仍然可以組weekOfYear而是使用總和我們可以使用(. .)gg(第一(…),(…),…)。
感謝亞當的建議總和(. .)並@doug使用的建議gg(第一(. .))。
我們玩這個,我做了示例筆記本,演示了兩種解決方案。