使用 Pandas DataFrame 处理时间
在本文中,我们将学习如何使用内置的 pandas 库生成和处理不同的时间戳。我们还使用 numpy 模块来生成和修改时间戳生成所需的数据库。
首选 IDE:Jupyter notebook
在开始本教程之前,我们必须安装 pandas 和 numpy 库。对于此 jupyter notebook 是测试和运行代码的最佳场所。要安装 pandas,我们必须运行以下命令。
>>> pip install pandas
如果我们运行此命令,所有依赖项将自动安装。完成后,我们必须重新启动内核以查看更改。
安装完所有依赖项后,我们可以将 pandas 导入为“p”。
在这里,我们调用数据帧构造函数并使用日期参数初始化一个周期为 4、频率为 2 小时的数据库。通过指定键“time”,我们正在显示数据库。
>>> pip install pandas
>>> import pandas as p
>>> data_struct = p.DataFrame()
>>> data_struct['time'] = p.date_range('14/7/2019', periods = 4, freq='3H')
>>> print(data_struct['time'])
0 2019-07-14 00:00:00
1 2019-07-14 03:00:00
2 2019-07-14 06:00:00
3 2019-07-14 09:00:00
Name: time, dtype: datetime64[ns]通过使用 <data_struct>.dt.<特征名称>提取特征。通过使用 head() 方法,我们显示数据库中的所有行。
>>> data_struct['year'] = data_struct['time'].dt.year >>> data_struct.head(4) time 0 2019-07-14 00:00:00 2019 1 2019-07-14 03:00:00 2019 2 2019-07-14 06:00:00 2019 3 2019-07-14 09:00:00 2019
在这里,我们实现了 numpy 模块中存在的 .array() 函数来创建时间字符串。这些字符串通过使用 pandas 库中的 .to_datetime() 方法转换为 DateTime。
>>> import numpy as n
>>> dt_timestring = n.array(['14-07-2019 07:26 AM', '13-07-2019 11:01 PM'])
>>> timestamps = [p.to_datetime(date, format ="%d-%m-%Y %I:%M %p", errors ="coerce") for date in dt_timestring]
>>> print(timestamps)
[Timestamp('2019-07-14 07:26:00'), Timestamp('2019-07-13 23:01:00')]在这里,我们使用日期对数据库进行索引,这意味着“date”字段将首先通过使用 .set_index() 方法显示。
>>> data_struct1 = p.DataFrame()
>>> data_struct1['date'] = p.date_range('18/07/2019', periods = 5, freq ='2H')
>>> data_struct1= data_struct1.set_index(data_struct1['date'])
>>> print(data_struct1.head(5))
date
date
2019-07-18 00:00:00 2019-07-18 00:00:00
2019-07-18 02:00:00 2019-07-18 02:00:00
2019-07-18 04:00:00 2019-07-18 04:00:00
2019-07-18 06:00:00 2019-07-18 06:00:00
2019-07-18 08:00:00 2019-07-18 08:00:00如果我们只想从数据库中显示特定的数据集,那么我们可以实现如下所述的命令 -
>>> data_struct2 = p.DataFrame()
>>> data_struct2['date'] = p.date_range('17/07/2019', periods =3, freq ='4H')
>>> print(data_struct2.head(5))
date
0 2019-07-17 00:00:00
1 2019-07-17 04:00:00
2 2019-07-17 08:00:00
>>> inp = data_struct2[(data_struct2['date'] > '2019-07-17 04:00:00')]
>>> print(inp)
date
2 2019-07-17 08:00:00结论
在本文中,我们学习了如何以多种方式打包和解包元组。
广告
数据结构
网络
关系型数据库管理系统
操作系统
Java
iOS
HTML
CSS
Android
Python
C 编程
C++
C#
MongoDB
MySQL
Javascript
PHP