Python - 使用 Pandas .query() 方法过滤数据


Pandas 是一个非常广泛使用的 Python 库,用于数据清洗、数据分析等。在本文中,我们将了解如何使用 query 方法从给定的数据集获取特定数据。我们可以在查询中包含单个条件和多个条件。

读取数据

让我们首先使用 Pandas 库将数据读取到 Pandas 数据框中。下面的程序就是这样做的。

示例

import pandas as pd

# Reading data frame from csv file
data = pd.read_csv("D:\heart.csv")

print(data)

输出

运行以上代码将得到以下结果:

使用单个条件的查询

接下来,我们看看如何使用单个条件与 query 方法结合使用。如您所见,仅返回了原始 303 行中的 119 行作为结果。

示例

import pandas as pd

# Data frame from csv file
data = pd.read_csv("D:\heart.csv")

data.query('chol < 230', inplace=True)

# Result
print(data)

输出

运行以上代码将得到以下结果:

使用多个条件的查询

与上述方法类似,我们可以将多个条件应用于 query 方法。这将进一步限制结果数据集。当我们还将年龄限制为大于 60 时,现在仅返回 79 行。

示例

import pandas as pd

# Data frame from csv file
data = pd.read_csv("D:\heart.csv")

data.query('chol < 230' and 'age > 60', inplace=True)

# Result
print(data)

输出

运行以上代码将得到以下结果:

更新于: 2020-07-22

2K+ 阅读量

开启您的 职业生涯

通过完成课程获得认证

开始学习
广告