使用 Pandas 读取 CSV 文件时如何跳过行


Python 内置了一个名为 read_csv 的方法,可用于在使用 Pandas 读取 CSV 文件时设置跳过行。CSV 代表逗号分隔值,是包含数据库的文件扩展名。此技术可用于任何涉及从 CSV 文件读取和处理数据的应用程序。各种应用例如数据过滤、Excel 工具等。

语法

以下语法在示例中使用:

read_csv('file_name.csv', skiprows= set the condition according to user choice)

这是 pandas 模块的内置函数,可以读取 CSV 文件的数据。它接受两个参数:

  • filename.csv - csv 是文件扩展名的简单表示形式。

  • skiprows - 此参数允许用户根据跳过/移除行的条件进行设置。

示例 1

在以下示例中,我们将从导入名为 pandas 的模块并将其引用对象作为 pd 开始程序。然后初始化名为 df 的变量,该变量通过内置方法 read_csv() 存储值,该方法接受两个参数 - demo.csv(文件名)和 skiprows(设置特定索引行)。skiprows 使用列表推导式设置行。最后,我们仅使用变量 df 以表格形式获取数据。

#skip multiple rows import pandas as pd df = pd.read_csv('demo.csv',skiprows=[1,5,12]) df

Explore our latest online courses and learn new skills at your own pace. Enroll and become a certified expert to boost your career.

输出

示例 2

在以下示例中,我们将展示如何跳过数据中的单行。首先,导入有助于设置读取数据操作的 pandas 模块。将 pd 作为对象引用,用于与 read_csv 赋值。通过使用此内置函数,它接受两个参数 - 'demo.csv'(文件名)和 skiprows(设置为值 1,从表中删除第一行)。

#skip only single rows import pandas as pd df = pd.read_csv('demo.csv',skiprows=1) df

输出

示例 3

在以下示例中,我们将首先导入可用于处理其名为 pd 的对象引用的 pandas 模块。接下来,我们将值存储为内置方法 read_csv 与 pd 一起使用,它接受两个参数 - 'demo.csv'(文件名)和 skiprows(设置偶数条件的值)。最后,使用变量 df 获取输出。

# skip rows based on even condition import pandas as pd df = pd.read_csv('demo.csv', skiprows=lambda x:x%2!=0) # print the months in even order df

输出

示例 4

在以下示例中,通过导入名为 pandas 的模块开始程序。然后使用内置方法 read_csv 设置两个参数 - 'demo.csv'(文件名)和 skiprows(将值设置为 lamda x:x>5,仅设置前五行)。接下来,使用变量 df 获取 5 行的数据。

# skip rows based on certain rows import pandas as pd df = pd.read_csv('demo.csv', skiprows= lambda x:x>5) df

输出

示例 5

在以下示例中,程序从 pandas 模块开始并将其对象引用设置为 pd。然后初始化名为 df 的变量,该变量通过使用内置方法存储值,它接受三个参数 - 'demo.csv'(文件名)、skiprows(在列表中设置值整数 2 和 10 以删除表中的数据)和 nrows(设置值为 10,表示仅有 10 行可用)。

import pandas as pd df = pd.read_csv('demo.csv', skiprows=[2,10],nrows=10) df

输出

结论

我们讨论了 skiprows 的概念,并对其应用了各种条件。我们对 skiprows 条件使用了跳过单行、跳过多行、基于偶数条件跳过行、基于某些条件跳过行以及从 CSV 文件跳过特定行。

更新于:2023年7月17日

2K+ 次浏览

启动你的 职业生涯

通过完成课程获得认证

开始学习
广告