Python Pandas – 从多列中查找唯一值
要查找多列中的唯一值,请使用 unique() 方法。假设你的 Pandas DataFrame 中的“EmpName”和“Zone”中包含员工记录。姓名和区域可能会重复,因为两个员工可能有相似的姓名,并且一个区域可能有多个员工。在这种情况下,如果你想要唯一的员工姓名,则对 DataFrame 使用 unique() 即可。
首先,导入必需的库。在此,我们将 pd 设为别名 −
import pandas as pd
首先,创建一个 DataFrame。在此,我们有两列 −
dataFrame = pd.DataFrame( { "EmpName": ['John', 'Ted', 'Jacob', 'Scarlett', 'Ami', 'Ted', 'Scarlett'],"Zone": ['North', 'South', 'South', 'East', 'West', 'East', 'North'] } )
从 DataFrame 列“EmpName”和“Zone”中获取唯一的员工姓名和区域 −
{pd.concat([dataFrame['EmpName'],dataFrame['Zone']]).unique()}
示例
以下是完整代码 −
import pandas as pd # Create DataFrame dataFrame = pd.DataFrame( { "EmpName": ['John', 'Ted', 'Jacob', 'Scarlett', 'Ami', 'Ted', 'Scarlett'],"Zone": ['North', 'South', 'South', 'East', 'West', 'East', 'North'] } ) print("DataFrame ...\n",dataFrame) # Fetch unique values from multiple columns print(f"\nFetching unique Values from the two columns and concatenate them:\n \ {pd.concat([dataFrame['EmpName'],dataFrame['Zone']]).unique()}")
输出
这将产生以下输出 −
DataFrame ... EmpName Zone 0 John North 1 Ted South 2 Jacob South 3 Scarlett East 4 Ami West 5 Ted East 6 Scarlett North Fetching unique Values from the two columns and concatenate them: ['John' 'Ted' 'Jacob' 'Scarlett' 'Ami' 'North' 'South' 'East' 'West']
广告