Python - 使用 Pandas .query() 方法过滤数据
Pandas 是一个非常广泛使用的 Python 库,用于数据清洗、数据分析等。在本文中,我们将了解如何使用 query 方法从给定的数据集获取特定数据。我们可以在查询中包含单个条件和多个条件。
读取数据
让我们首先使用 Pandas 库将数据读取到 Pandas 数据框中。下面的程序就是这样做的。
示例
import pandas as pd # Reading data frame from csv file data = pd.read_csv("D:\heart.csv") print(data)
输出
运行以上代码将得到以下结果:
使用单个条件的查询
接下来,我们看看如何使用单个条件与 query 方法结合使用。如您所见,仅返回了原始 303 行中的 119 行作为结果。
示例
import pandas as pd # Data frame from csv file data = pd.read_csv("D:\heart.csv") data.query('chol < 230', inplace=True) # Result print(data)
输出
运行以上代码将得到以下结果:
使用多个条件的查询
与上述方法类似,我们可以将多个条件应用于 query 方法。这将进一步限制结果数据集。当我们还将年龄限制为大于 60 时,现在仅返回 79 行。
示例
import pandas as pd # Data frame from csv file data = pd.read_csv("D:\heart.csv") data.query('chol < 230' and 'age > 60', inplace=True) # Result print(data)
输出
运行以上代码将得到以下结果:
广告