使用 Pandas 读取 CSV 文件时如何跳过行
Python 内置了一个名为 read_csv 的方法,可用于在使用 Pandas 读取 CSV 文件时设置跳过行。CSV 代表逗号分隔值,是包含数据库的文件扩展名。此技术可用于任何涉及从 CSV 文件读取和处理数据的应用程序。各种应用例如数据过滤、Excel 工具等。
语法
以下语法在示例中使用:
read_csv('file_name.csv', skiprows= set the condition according to user choice)
这是 pandas 模块的内置函数,可以读取 CSV 文件的数据。它接受两个参数:
filename.csv - csv 是文件扩展名的简单表示形式。
skiprows - 此参数允许用户根据跳过/移除行的条件进行设置。
示例 1
在以下示例中,我们将从导入名为 pandas 的模块并将其引用对象作为 pd 开始程序。然后初始化名为 df 的变量,该变量通过内置方法 read_csv() 存储值,该方法接受两个参数 - demo.csv(文件名)和 skiprows(设置特定索引行)。skiprows 使用列表推导式设置行。最后,我们仅使用变量 df 以表格形式获取数据。
#skip multiple rows import pandas as pd df = pd.read_csv('demo.csv',skiprows=[1,5,12]) df
Explore our latest online courses and learn new skills at your own pace. Enroll and become a certified expert to boost your career.
输出
示例 2
在以下示例中,我们将展示如何跳过数据中的单行。首先,导入有助于设置读取数据操作的 pandas 模块。将 pd 作为对象引用,用于与 read_csv 赋值。通过使用此内置函数,它接受两个参数 - 'demo.csv'(文件名)和 skiprows(设置为值 1,从表中删除第一行)。
#skip only single rows import pandas as pd df = pd.read_csv('demo.csv',skiprows=1) df
输出
示例 3
在以下示例中,我们将首先导入可用于处理其名为 pd 的对象引用的 pandas 模块。接下来,我们将值存储为内置方法 read_csv 与 pd 一起使用,它接受两个参数 - 'demo.csv'(文件名)和 skiprows(设置偶数条件的值)。最后,使用变量 df 获取输出。
# skip rows based on even condition import pandas as pd df = pd.read_csv('demo.csv', skiprows=lambda x:x%2!=0) # print the months in even order df
输出
示例 4
在以下示例中,通过导入名为 pandas 的模块开始程序。然后使用内置方法 read_csv 设置两个参数 - 'demo.csv'(文件名)和 skiprows(将值设置为 lamda x:x>5,仅设置前五行)。接下来,使用变量 df 获取 5 行的数据。
# skip rows based on certain rows import pandas as pd df = pd.read_csv('demo.csv', skiprows= lambda x:x>5) df
输出
示例 5
在以下示例中,程序从 pandas 模块开始并将其对象引用设置为 pd。然后初始化名为 df 的变量,该变量通过使用内置方法存储值,它接受三个参数 - 'demo.csv'(文件名)、skiprows(在列表中设置值整数 2 和 10 以删除表中的数据)和 nrows(设置值为 10,表示仅有 10 行可用)。
import pandas as pd df = pd.read_csv('demo.csv', skiprows=[2,10],nrows=10) df
输出
结论
我们讨论了 skiprows 的概念,并对其应用了各种条件。我们对 skiprows 条件使用了跳过单行、跳过多行、基于偶数条件跳过行、基于某些条件跳过行以及从 CSV 文件跳过特定行。