使用 Pandas 读取 CSV 文件时如何跳过行

Python 内置了一个名为 read_csv 的方法，可用于在使用 Pandas 读取 CSV 文件时设置跳过行。CSV 代表逗号分隔值，是包含数据库的文件扩展名。此技术可用于任何涉及从 CSV 文件读取和处理数据的应用程序。各种应用例如数据过滤、Excel 工具等。

语法

以下语法在示例中使用：

read_csv('file_name.csv', skiprows= set the condition according to user choice)

这是 pandas 模块的内置函数，可以读取 CSV 文件的数据。它接受两个参数：

filename.csv - csv 是文件扩展名的简单表示形式。
skiprows - 此参数允许用户根据跳过/移除行的条件进行设置。

示例 1

在以下示例中，我们将从导入名为 pandas 的模块并将其引用对象作为 pd 开始程序。然后初始化名为 df 的变量，该变量通过内置方法 read_csv() 存储值，该方法接受两个参数 - demo.csv（文件名）和 skiprows（设置特定索引行）。skiprows 使用列表推导式设置行。最后，我们仅使用变量 df 以表格形式获取数据。

#skip multiple rows
import pandas as pd
df = pd.read_csv('demo.csv',skiprows=[1,5,12])
df

输出

示例 2

在以下示例中，我们将展示如何跳过数据中的单行。首先，导入有助于设置读取数据操作的 pandas 模块。将 pd 作为对象引用，用于与 read_csv 赋值。通过使用此内置函数，它接受两个参数 - 'demo.csv'（文件名）和 skiprows（设置为值 1，从表中删除第一行）。

#skip only single rows
import pandas as pd
df = pd.read_csv('demo.csv',skiprows=1)
df

输出

示例 3

在以下示例中，我们将首先导入可用于处理其名为 pd 的对象引用的 pandas 模块。接下来，我们将值存储为内置方法 read_csv 与 pd 一起使用，它接受两个参数 - 'demo.csv'（文件名）和 skiprows（设置偶数条件的值）。最后，使用变量 df 获取输出。

# skip rows based on even condition
import pandas as pd
df = pd.read_csv('demo.csv', skiprows=lambda x:x%2!=0)
# print the months in even order  
df

输出

示例 4

在以下示例中，通过导入名为 pandas 的模块开始程序。然后使用内置方法 read_csv 设置两个参数 - 'demo.csv'（文件名）和 skiprows（将值设置为 lamda x:x>5，仅设置前五行）。接下来，使用变量 df 获取 5 行的数据。

# skip rows based on certain rows
import pandas as pd
df = pd.read_csv('demo.csv', skiprows= lambda x:x>5)
df

输出

示例 5

在以下示例中，程序从 pandas 模块开始并将其对象引用设置为 pd。然后初始化名为 df 的变量，该变量通过使用内置方法存储值，它接受三个参数 - 'demo.csv'（文件名）、skiprows（在列表中设置值整数 2 和 10 以删除表中的数据）和 nrows（设置值为 10，表示仅有 10 行可用）。

import pandas as pd
df = pd.read_csv('demo.csv', skiprows=[2,10],nrows=10)
df

输出

结论

我们讨论了 skiprows 的概念，并对其应用了各种条件。我们对 skiprows 条件使用了跳过单行、跳过多行、基于偶数条件跳过行、基于某些条件跳过行以及从 CSV 文件跳过特定行。

Tapas Kumar Ghosh

更新于：2023年7月17日

2K+ 次浏览

启动你的职业生涯

通过完成课程获得认证

开始学习