Python Pandas – 从多列中查找唯一值


要查找多列中的唯一值,请使用 unique() 方法。假设你的 Pandas DataFrame 中的“EmpName”和“Zone”中包含员工记录。姓名和区域可能会重复,因为两个员工可能有相似的姓名,并且一个区域可能有多个员工。在这种情况下,如果你想要唯一的员工姓名,则对 DataFrame 使用 unique() 即可。

首先,导入必需的库。在此,我们将 pd 设为别名 −

import pandas as pd

首先,创建一个 DataFrame。在此,我们有两列 −

dataFrame = pd.DataFrame( { "EmpName": ['John', 'Ted', 'Jacob', 'Scarlett', 'Ami', 'Ted', 'Scarlett'],"Zone": ['North', 'South', 'South', 'East', 'West', 'East', 'North'] } )

从 DataFrame 列“EmpName”和“Zone”中获取唯一的员工姓名和区域 −

{pd.concat([dataFrame['EmpName'],dataFrame['Zone']]).unique()}

示例

以下是完整代码 −

import pandas as pd # Create DataFrame dataFrame = pd.DataFrame( { "EmpName": ['John', 'Ted', 'Jacob', 'Scarlett', 'Ami', 'Ted', 'Scarlett'],"Zone": ['North', 'South', 'South', 'East', 'West', 'East', 'North'] } ) print("DataFrame ...\n",dataFrame) # Fetch unique values from multiple columns print(f"\nFetching unique Values from the two columns and concatenate them:\n \ {pd.concat([dataFrame['EmpName'],dataFrame['Zone']]).unique()}")

输出

这将产生以下输出 −

DataFrame ...
    EmpName   Zone
0      John  North
1       Ted  South
2     Jacob  South
3  Scarlett   East
4       Ami   West
5       Ted   East
6  Scarlett  North

Fetching unique Values from the two columns and concatenate them:
['John' 'Ted' 'Jacob' 'Scarlett' 'Ami' 'North' 'South' 'East' 'West']

更新于:29-9 月-2021

已超过 5K 次浏览

启动职业生涯

完成课程获得认证

开始
广告