统计 Pandas 中 DataFrame 列中某个值的频率
要在 Pandas 中统计 DataFrame 列中某个值的频率,我们可以使用 df.groupby(列名).size() 方法。
步骤
创建一个二维可变性、潜在异构表格数据 df。
打印输入 DataFrame,df。
打印列 x 的频率。
打印列 y 的频率。
打印列 z 的频率。
示例
import pandas as pd df = pd.DataFrame( { "x": [5, 2, 1, 5], "y": [4, 10, 5, 10], "z": [1, 1, 5, 1] } ) print "Input DataFrame is:
", df col = "x" count = df.groupby('x').size() print "Frequency of values in column ", col, "is:
", count col = "y" count = df.groupby('y').size() print "Frequency of values in column ", col, "is:
", count col = "z" count = df.groupby('z').size() print "Frequency of values in column ", col, "is:
", count
输出
Input DataFrame is: x y z 0 5 4 1 1 2 10 1 2 1 5 5 3 5 10 1 Frequency of values in column x is: x 1 1 2 1 5 2 dtype: int64 Frequency of values in column y is: y 4 1 5 1 10 2 dtype: int64 Frequency of values in column z is: z 1 3 5 1 dtype: int64
广告