统计 Python Pandas 中每组的唯一值


要统计 Python Pandas 中每组的唯一值,我们可以使用df.groupby('column_name').count()

步骤

  • 创建一个二维、可变大小、可能异构的表格数据,df
  • 打印输入的 DataFrame,df
  • 使用df.groupby('rank')['id'].count()查找每组的唯一值计数并将其存储在变量“count”中。
  • 打印步骤 3 中的计数。

示例

import pandas as pd

df = pd.DataFrame(
    {
       "id": [1, 2, 1, 3, 5, 1, 4, 3, 6, 7],
       'rank': [1, 4, 1, 2, 1, 4, 6, 1, 5, 3]
    }
)

print"Input DataFrame 1 is:\n", df
count = df.groupby('rank')['id'].count()
print"Frequency of ranks:\n", count

输出

Input DataFrame 1 is:

   id  rank
0   1    1
1   2    4
2   1    1
3   3    2
4   5    1
5   1    4
6   4    6
7   3    1 
8   6    5
9   7    3
Frequency of ranks:
rank
1  4
2  1
3  1
4  2
5  1
6  1
Name: id, dtype: int64

更新于:14-Sep-2021

6K+ 查看

开启您的 职业生涯

通过完成课程获得认证

开始
广告