pyspark.pandas.Series.resample

係列。 重新取樣 ( 規則:str,關閉:可選(str]=沒有一個,標簽:可選(str]=沒有一個,:可選(係列]=沒有一個 )→SeriesResampler

重新取樣時間序列數據。

方便的時間序列的頻率轉換和重采樣的方法。對象必須有一個datetime-like指數(隻支持DatetimeIndex現在),或者調用者必須通過一係列datetime-like的標簽/索引關鍵字參數。

參數
規則 str

偏移量表示目標字符串或對象轉換。目前,支持單位是{' Y ', ' ', ' M ', ' D ',‘H’,‘T’,‘敏’,‘S’}。

關閉 {{‘正確的’,‘左’}},默認沒有

哪一方的本間隔是關閉的。默認的是“左”對所有頻率補償除了“A”,“Y”和“M”都有一個默認的“正確”的。

標簽 {{‘正確的’,‘左’}},默認沒有

本標簽,標簽邊緣桶。默認的是“左”對所有頻率補償除了“A”,“Y”和“M”都有一個默認的“正確”的。

係列,可選

DataFrame,列使用而不是指數重采樣。必須datetime-like列。

返回
SeriesResampler

另請參閱

DataFrame.resample

重新取樣DataFrame。

groupby

集團通過映射函數、標簽或標簽的列表。

例子

首先創建一個係列9一分鍾時間戳。

> > >指數=pddate_range(“開戶”,=9,頻率=“T”)> > >係列=ps係列(範圍(9),指數=指數,的名字=“V”)> > >係列2000-01-01就是02000-01-01 00:01:00 12000-01-01 00:02:00 22000-01-01 00:03:00 32000-01-01 00:04:00 42000-01-01 00:05:00 52000-01-01 00:06:00 62000-01-01 00:07:00 72000-01-01 00:08:00 8名稱:V, dtype: int64

Downsample係列3分鍾垃圾箱和和時間戳的值落入一個垃圾箱。

> > >係列重新取樣(“3 t”)總和()sort_index()2000-01-01就是3.02000-01-01 00:03:00 12.02000-01-01 00:06:00 21.0名稱:V, dtype: float64

Downsample係列3分鍾垃圾箱如上,但標簽每本使用正確的邊緣,而不是離開。請注意桶中的值用作標簽是不包括在桶中,它的標簽。例如,在原始係列桶2000-01-0100:03:00包含值3,但總結價值重新取樣桶的標簽2000-01-0100:03:00不包括3(如果是,總結值是6,不是3)。包括這個值接近的右側本間隔見下麵的例子。

> > >係列重新取樣(“3 t”,標簽=“對”)總和()sort_index()2000-01-01 00:03:00 3.02000-01-01 00:06:00 12.02000-01-01 00:09:00 21.0名稱:V, dtype: float64

Downsample係列3分鍾垃圾箱如上,但接近的右側本間隔。

> > >係列重新取樣(“3 t”,標簽=“對”,關閉=“對”)總和()sort_index()2000-01-01就是0.02000-01-01 00:03:00 6.02000-01-01 00:06:00 15.02000-01-01 00:09:00 15.0名稱:V, dtype: float64

Upsample係列30秒進垃圾箱中。

> > >係列重新取樣(30年代的)總和()sort_index()(0:5]#選擇前5行2000-01-01就是0.02000-01-01 00:00:30 0.02000-01-01 00:01:00 1.02000-01-01 00:01:30 0.02000-01-01 00:02:00 2.0名稱:V, dtype: float64