使用 Python Pandas 中的 'in' 和 'not in' 运算符检查 DataFrame 中是否存在值


Pandas 是一个功能强大的 Python 库,广泛用于数据处理和分析。在处理 DataFrame 时,经常需要检查特定值是否在数据集中存在。在本教程中,我们将探讨如何在 Pandas 中使用 'in' 和 'not in' 运算符来确定 DataFrame 中值的存在或不存在。

使用 "in" 运算符检查值

Python 中的 'in' 运算符用于检查值是否在可迭代对象中存在。在 Pandas 的上下文中,我们可以使用 'in' 运算符来验证值是否在 DataFrame 中存在。让我们考虑两个示例,演示如何使用 'in' 运算符检查数据框中值的存在。

示例 1:检查 DataFrame 列中的值

在本例中,我们创建了一个包含两列的 DataFrame:'Name' 和 'Age'。我们想要检查值 'Alice' 是否存在于 'Name' 列中。通过使用 'in' 运算符,我们使用 ".values" 属性将该值与 'Name' 列中存在的值进行比较。

请考虑以下代码。

import pandas as pd

# Create a DataFrame
df = pd.DataFrame({'Name': ['John', 'Alice', 'Bob', 'Emily'],'Age': [25, 30, 28, 35]})

# Check if a value exists in the 'Name' column
value = 'Alice'
if value in df['Name'].values:
   print(f"{value} exists in the DataFrame.")
else:
   print(f"{value} does not exist in the DataFrame.")

输出

如果找到该值,则显示相应的邮件;否则,将打印不同的邮件。

执行此代码时,将产生以下输出:

Alice exists in the DataFrame.

示例 2:检查 DataFrame 中的值

在本例中,我们想要检查值 '28' 是否存在于 DataFrame 中的任何位置。我们使用 "in" 运算符使用 ".values" 属性将该值与 DataFrame 中的所有值进行比较。

请考虑以下代码:

import pandas as pd

# Create a DataFrame
df = pd.DataFrame({'Name': ['John', 'Alice', 'Bob', 'Emily'],'Age': [25, 30, 28, 35]})

# Check if a value exists in the DataFrame
value = 28
if value in df.values:
   print(f"{value} exists in the DataFrame.")
else:
   print(f"{value} does not exist in the DataFrame.")

输出

如果该值存在,则显示相应的邮件;否则,将打印不同的邮件。

执行此代码时,将产生以下输出:

28 exists in the DataFrame.

使用 "not in" 运算符检查值

在本例中,我们创建了一个包含两列的 DataFrame:"Name" 和 "Age"。我们的目标是检查值 "Michael" 是否不存在于 'Name' 列中。

通过使用 "not in" 运算符,我们使用 ".values" 属性将该值与 "Name" 列中的值进行比较。

请考虑以下代码。

import pandas as pd

# Create a DataFrame
df = pd.DataFrame({'Name': ['John', 'Alice', 'Bob', 'Emily'],'Age': [25, 30, 28, 35]})

# Check if a value does not exist in the 'Name' column
value = 'Michael'
if value not in df['Name'].values:
   print(f"{value} does not exist in the DataFrame.")
else:
   print(f"{value} exists in the DataFrame.")

输出

如果未找到该值,则显示相应的邮件;否则,将打印不同的邮件。

执行此代码时,将产生以下输出:

Michael does not exist in the DataFrame.

结论

在本教程中,我们探讨了如何在 Pandas 中使用 "in" 和 "not in" 运算符来检查 DataFrame 中值的存在或不存在。通过利用这些运算符,我们可以有效地确定特定列或整个 DataFrame 中值的存在或不存在。

通过提供的代码示例,我们演示了如何使用 'in' 运算符来检查值是否存在于 DataFrame 列中或整个 DataFrame 中。此外,我们展示了如何使用 'not in' 运算符来检查值的不存在。

通过使用这些运算符,分析师和数据科学家可以有效地验证数据的存在或不存在,使他们能够根据 DataFrame 结构中可用的信息做出明智的决策。

总之,Pandas 中的 "in" 和 "not in" 运算符为值存在和不存在检查提供了强大的工具,有助于高效地进行数据探索和分析。

更新于:2023年9月1日

4K+ 次查看

开启您的 职业生涯

通过完成课程获得认证

开始学习
广告