如何使用Pandas显示特定年份的星期几?


Pandas是一个开源的Python库,用于数据处理和分析。

它提供了强大的数据结构,如Series(一维标记数组)和DataFrame(二维标记数组),可以处理不同类型的数据和操作,例如从各种文件格式读取和写入数据、合并、过滤、聚合和透视数据,以及处理缺失或重复数据。

Pandas还支持时间序列数据并提供广泛的数据可视化功能。其易用性、多功能性和性能使其成为数据科学家和分析师在探索性数据分析、数据清洗和特征工程任务中流行的选择。

众所周知,一年有52周。在本例中,我们想知道特定年份中某一天的日期。Pandas对此问题非常有帮助,只需几行代码即可提供所有日期。

语法

要在Pandas中显示特定年份的星期几,需要遵循以下语法:

range_of_dates = pandas.date_range(start, periods, freq)
result = pandas.Series(range_of_dates)
print(result)

此语法使用pandas.date_range()函数创建一个日期范围,并使用pandas.Series()函数使用生成的日期范围创建一个Pandas序列。

pandas.date_range()函数接受三个参数:

  • start  范围的开始日期。

  • periods  范围内的周期数。

  • freq  范围的频率。

生成的日期范围存储在range_of_dates变量中。然后使用pandas.Series()函数使用range_of_dates变量创建一个名为result的Pandas序列。

示例

此代码使用别名pd导入Pandas库。变量day和yy定义为字符串。然后,代码使用这些变量创建一个日期范围,该范围包含52周,从yy变量中指定的年份的1月1日开始,频率为每周特定的一天(在day变量中指定)。最后,我们得到了2023年所有星期一的日期。

具体来说,pd.date_range()函数用于创建一个日期范围,其开始日期设置为yy+'-01-01',表示yy变量中指定的年份的1月1日。periods参数设置为52,以创建一个52周的日期范围。freq参数设置为'W-'+(day[:3]).lower(),其中(day[:3]).lower()提取day中字符串的前三个字符并将其转换为小写,而'W-'表示每周结束于特定星期几,导致每周在指定的星期几出现。

生成的日期范围存储在range_of_dates变量中,然后将其作为参数传递给pd.Series()函数以创建一个名为result的Pandas序列。然后使用result变量名在输出中显示result变量。

import pandas as pd
day = "monday"
yy = "2023"
range_of_dates = pd.date_range(yy+'-01-01', periods=52, freq=('W-'+(day[:3]).lower()))
result = pd.Series(range_of_dates)
print(result)

输出

0    2023-01-02
1    2023-01-09
2    2023-01-16
3    2023-01-23
4    2023-01-30
5    2023-02-06
6    2023-02-13
7    2023-02-20
8    2023-02-27
9    2023-03-06
10   2023-03-13
11   2023-03-20
12   2023-03-27
13   2023-04-03
14   2023-04-10
15   2023-04-17
16   2023-04-24
17   2023-05-01
18   2023-05-08
19   2023-05-15
20   2023-05-22
21   2023-05-29
22   2023-06-05
23   2023-06-12
24   2023-06-19
25   2023-06-26
26   2023-07-03
27   2023-07-10
28   2023-07-17
29   2023-07-24
30   2023-07-31
31   2023-08-07
32   2023-08-14
33   2023-08-21
34   2023-08-28
35   2023-09-04
36   2023-09-11
37   2023-09-18
38   2023-09-25
39   2023-10-02
40   2023-10-09
41   2023-10-16
42   2023-10-23
43   2023-10-30
44   2023-11-06
45   2023-11-13
46   2023-11-20
47   2023-11-27
48   2023-12-04
49   2023-12-11
50   2023-12-18
51   2023-12-25
dtype: datetime64[ns]

示例

此代码类似于前面的代码,对变量day和yr进行了一些更改。具体来说,day现在设置为全大写的“FRIDAY”,年份设置为“2023”。

代码还使用pd.date_range()函数创建一个日期范围,该范围从yr变量中指定的年份的1月1日开始,总共52个周期,频率为每周特定的一天(在本例中为星期五)。频率使用字符串格式'W-'+(day[:3]).lower()指定,该格式提取day中字符串的前三个字符,使用lower()方法将其转换为小写,并将其附加到'W-',表示每周在特定的一天出现。

生成的日期范围存储在range_of_dates变量中,然后将其作为参数传递给pd.Series()函数以创建一个名为result的Pandas序列。最后,显示result变量的输出。

import pandas as pd
day = "FRIDAY"
yr = "2023"
range_of_dates = pd.date_range(yr+'-01-01', periods=52, freq=('W-'+(day[:3]).lower()))
result = pd.Series(range_of_dates)
print(result)

输出

0    2023-01-06
1    2023-01-13
2    2023-01-20
3    2023-01-27
4    2023-02-03
5    2023-02-10
6    2023-02-17
7    2023-02-24
8    2023-03-03
9    2023-03-10
10   2023-03-17
11   2023-03-24
12   2023-03-31
13   2023-04-07
14   2023-04-14
15   2023-04-21
16   2023-04-28
17   2023-05-05
18   2023-05-12
19   2023-05-19
20   2023-05-26
21   2023-06-02
22   2023-06-09
23   2023-06-16
24   2023-06-23
25   2023-06-30
26   2023-07-07
27   2023-07-14
28   2023-07-21
29   2023-07-28
30   2023-08-04
31   2023-08-11
32   2023-08-18
33   2023-08-25
34   2023-09-01
35   2023-09-08
36   2023-09-15
37   2023-09-22
38   2023-09-29
39   2023-10-06
40   2023-10-13
41   2023-10-20
42   2023-10-27
43   2023-11-03
44   2023-11-10
45   2023-11-17
46   2023-11-24
47   2023-12-01
48   2023-12-08
49   2023-12-15
50   2023-12-22
51   2023-12-29
dtype: datetime64[ns]

结论

我们学习了如何使用Pandas显示特定年份的星期几。使用Pandas显示特定年份的星期几是一个有用的练习,它演示了如何生成具有特定频率的日期范围,并提供了对时间推移的模式和趋势的见解。凭借其直观且灵活的语法,Pandas是任何使用时间序列数据的数据分析师或科学家必不可少的工具。

更新于:2023年5月12日

浏览量:181

启动您的职业生涯

完成课程获得认证

开始学习
广告