使用 Python Pandas 中的 'in' 和 'not in' 运算符检查 DataFrame 中是否存在值
Pandas 是一个功能强大的 Python 库,广泛用于数据处理和分析。在处理 DataFrame 时,经常需要检查特定值是否在数据集中存在。在本教程中,我们将探讨如何在 Pandas 中使用 'in' 和 'not in' 运算符来确定 DataFrame 中值的存在或不存在。
使用 "in" 运算符检查值
Python 中的 'in' 运算符用于检查值是否在可迭代对象中存在。在 Pandas 的上下文中,我们可以使用 'in' 运算符来验证值是否在 DataFrame 中存在。让我们考虑两个示例,演示如何使用 'in' 运算符检查数据框中值的存在。
示例 1:检查 DataFrame 列中的值
在本例中,我们创建了一个包含两列的 DataFrame:'Name' 和 'Age'。我们想要检查值 'Alice' 是否存在于 'Name' 列中。通过使用 'in' 运算符,我们使用 ".values" 属性将该值与 'Name' 列中存在的值进行比较。
请考虑以下代码。
import pandas as pd # Create a DataFrame df = pd.DataFrame({'Name': ['John', 'Alice', 'Bob', 'Emily'],'Age': [25, 30, 28, 35]}) # Check if a value exists in the 'Name' column value = 'Alice' if value in df['Name'].values: print(f"{value} exists in the DataFrame.") else: print(f"{value} does not exist in the DataFrame.")
输出
如果找到该值,则显示相应的邮件;否则,将打印不同的邮件。
执行此代码时,将产生以下输出:
Alice exists in the DataFrame.
示例 2:检查 DataFrame 中的值
在本例中,我们想要检查值 '28' 是否存在于 DataFrame 中的任何位置。我们使用 "in" 运算符使用 ".values" 属性将该值与 DataFrame 中的所有值进行比较。
请考虑以下代码:
import pandas as pd # Create a DataFrame df = pd.DataFrame({'Name': ['John', 'Alice', 'Bob', 'Emily'],'Age': [25, 30, 28, 35]}) # Check if a value exists in the DataFrame value = 28 if value in df.values: print(f"{value} exists in the DataFrame.") else: print(f"{value} does not exist in the DataFrame.")
输出
如果该值存在,则显示相应的邮件;否则,将打印不同的邮件。
执行此代码时,将产生以下输出:
28 exists in the DataFrame.
使用 "not in" 运算符检查值
在本例中,我们创建了一个包含两列的 DataFrame:"Name" 和 "Age"。我们的目标是检查值 "Michael" 是否不存在于 'Name' 列中。
通过使用 "not in" 运算符,我们使用 ".values" 属性将该值与 "Name" 列中的值进行比较。
请考虑以下代码。
import pandas as pd # Create a DataFrame df = pd.DataFrame({'Name': ['John', 'Alice', 'Bob', 'Emily'],'Age': [25, 30, 28, 35]}) # Check if a value does not exist in the 'Name' column value = 'Michael' if value not in df['Name'].values: print(f"{value} does not exist in the DataFrame.") else: print(f"{value} exists in the DataFrame.")
输出
如果未找到该值,则显示相应的邮件;否则,将打印不同的邮件。
执行此代码时,将产生以下输出:
Michael does not exist in the DataFrame.
结论
在本教程中,我们探讨了如何在 Pandas 中使用 "in" 和 "not in" 运算符来检查 DataFrame 中值的存在或不存在。通过利用这些运算符,我们可以有效地确定特定列或整个 DataFrame 中值的存在或不存在。
通过提供的代码示例,我们演示了如何使用 'in' 运算符来检查值是否存在于 DataFrame 列中或整个 DataFrame 中。此外,我们展示了如何使用 'not in' 运算符来检查值的不存在。
通过使用这些运算符,分析师和数据科学家可以有效地验证数据的存在或不存在,使他们能够根据 DataFrame 结构中可用的信息做出明智的决策。
总之,Pandas 中的 "in" 和 "not in" 运算符为值存在和不存在检查提供了强大的工具,有助于高效地进行数据探索和分析。