获取 Pandas DataFrame 的最后 n 条记录


数据分析经常面临处理海量数据集的问题,这通常需要对数据进行修改以获得有价值的见解。在某些情况下,能够从 Pandas DataFrame 中提取最新的 n 个条目可能很有用。本文旨在提供一个完整的操作指南,以成功完成此操作。

安装和语法

pip install pandas

安装 Pandas 后,您可以使用 CSV 文件或数据库查询的结果从各种数据源创建 DataFrame。

import pandas as pd
data = {'Name': ['John', 'Mark', 'Alice', 'Julie', 'Lisa', 'David'],
        'Age': [23, 34, 45, 19, 28, 31],
        'Gender': ['M', 'M', 'F', 'F', 'F', 'M']}
df = pd.DataFrame(data)

算法

Pandas DataFrame 的 tail() 函数检索 DataFrame 的最后 n 行,可用于获取 DataFrame 的最后 n 个条目。完成此任务所使用的算法包括以下步骤

  • 可以使用 shape 参数确定 DataFrame 中的行数。

  • 要获取 DataFrame 的最后 n 行,请使用 tail() 函数。

  • 您可以选择将生成的 DataFrame 的索引设置为 0。

示例

现在让我们来看一个示例,演示如何检索 DataFrame 的最后 3 条记录。我们将使用上一节中创建的 DataFrame。

import pandas as pd

data = {'Name': ['John', 'Mark', 'Alice', 'Julie', 'Lisa', 'David'],
        'Age': [23, 34, 45, 19, 28, 31],
        'Gender': ['M', 'M', 'F', 'F', 'F', 'M']}

df = pd.DataFrame(data)

last_3_records = df.tail(3)
print(last_3_records)

输出

    Name  Age Gender
3  Julie   19      F
4   Lisa   28      F
5  David   31      M

生成的 last_3_records DataFrame 将包含 df DataFrame 的最后三行。或者,我们可以使用 reset_index() 函数将生成的 DataFrame 的索引重置为从 0 开始。

last_3_records = last_3_records.reset_index(drop=True)

生成的 last_3_records DataFrame 的索引将从 0 开始。

    Name  Age Gender
0  Julie   19      F
1   Lisa   28      F
2  David   31      M

应用场景

检索 Pandas DataFrame 的最后 n 条记录在各种场景中都很有用,例如

  • 分析大型数据集中最新的数据条目。

  • 测试和验证数据插入 DataFrame。

  • 使用最近的数据条目构建机器学习模型。

结论

总之,检索 Pandas DataFrame 的最后 n 条记录是一项简单而高效的任务,可以使用 tail() 函数完成。我们可以选择将生成的 DataFrame 的索引重置为从 0 开始。此技术在各种场景中都很有用,例如分析最近的数据条目或验证数据插入 DataFrame。

更新于: 2023年7月18日

2K+ 次浏览

开启您的 职业生涯

通过完成课程获得认证

立即开始
广告