如何使用 asfreq() 方法对时间序列进行上采样?


通过使用 pandas 的 asfreq() 方法,我们可以对时间序列进行上采样,并且可以使用 fill_value 参数填充 NaN 值。

pandas.Series.asfreq() 方法用于将时间序列转换为指定的频率。结果,它将返回一个以指定频率重新索引的时间序列。

让我们使用 pandas 的 date_range 模块创建一个时间序列对象,并使用 pandas.series.asfreq() 方法对其进行上采样。

示例 1

import pandas as pd

# creating dates
date = pd.date_range("2021-07-01", periods=2, freq="M")

# creating pandas Series with date range index
s = pd.Series([5, 6], index=date)
print(s)

# upsample the Timeseries with fill value
print("Output of asfreq:",s.asfreq(freq='D',fill_value=5))

说明

在以下示例中,我们使用 pandas 的 date_range 函数创建了一个 pandas 时间序列对象。然后,我们将时间序列从月份上采样到“D”天频率,并使用标量“5”填充缺失值。

输出

2021-07-31 5
2021-08-31 6
Freq: M, dtype: int64

Output of asfreq:
2021-07-31 5
2021-08-01 5
2021-08-02 5
2021-08-03 5
2021-08-04 5
2021-08-05 5
2021-08-06 5
2021-08-07 5
2021-08-08 5
2021-08-09 5
2021-08-10 5
2021-08-11 5
2021-08-12 5
2021-08-13 5
2021-08-14 5
2021-08-15 5
2021-08-16 5
2021-08-17 5
2021-08-18 5
2021-08-19 5
2021-08-20 5
2021-08-21 5
2021-08-22 5
2021-08-23 5
2021-08-24 5
2021-08-25 5
2021-08-26 5
2021-08-27 5
2021-08-28 5
2021-08-29 5
2021-08-30 5
2021-08-31 6
Freq: D, dtype: int64

初始时间序列由 2 个周期组成,频率为月。之后,我们使用 asfreq() 方法将该时间序列对象上采样到“D”天频率。结果时间序列有 32 个周期,标量值为“5”。

示例 2

import pandas as pd

# create the index
index = pd.date_range('2021-07-1', periods=5, freq='T')

#creating pandas Series with date index
series = pd.Series([2,3,None,4,5], index=index)

print(series)

# upsample the Timeseries with fill value
print("Converted time series",series.asfreq(freq='30s',fill_value=1))

说明

在上述示例中,我们使用 Date_range 方法创建了一个 pandas 时间序列,它有 5 个周期,频率为“T”。之后,我们使用 asfreq() 方法将该序列对象的频率更改为“30s”,此过程称为上采样。

输出

2021-07-01 00:00:00 2.0
2021-07-01 00:01:00 3.0
2021-07-01 00:02:00 NaN
2021-07-01 00:03:00 4.0
2021-07-01 00:04:00 5.0
Freq: T, dtype: float64

Converted time series
2021-07-01 00:00:00 2.0
2021-07-01 00:00:30 1.0
2021-07-01 00:01:00 3.0
2021-07-01 00:01:30 1.0
2021-07-01 00:02:00 NaN
2021-07-01 00:02:30 1.0
2021-07-01 00:03:00 4.0
2021-07-01 00:03:30 1.0
2021-07-01 00:04:00 5.0
Freq: 30S, dtype: float64

在上面的输出块中,我们可以看到初始时间序列对象和上采样时间序列对象。上采样时间序列对象有 9 个周期,频率为“30s”。

pandas.Series.asfreq() 方法中的 fill_value 参数不会填充给定时间序列对象中已经存在的 NaN 或缺失值。这就是为什么在上采样序列对象中存在 NaN 值的原因。

更新于: 2022年3月9日

256 次浏览

开启你的 职业生涯

通过完成课程获得认证

立即开始
广告