Pandas 中 series.describe 方法有什么作用?
pandas.series 中的 describe() 方法用于生成序列对象的统计描述。此方法分析数值和对象序列的描述。
因此,describe() 方法返回序列的汇总统计信息。它根据输入序列对象的类型而有所不同。
对于数值序列,describe() 方法分析基本统计信息,如计数、均值、标准差、最小值、最大值和分位数(25%、50% 和 75%)。50% 分位数与中位数相同。
如果序列对象包含对象类型数据,则 describe() 方法分析基本统计信息,如计数、唯一值、最常出现的值和频率。
示例 1
# importing required packages import pandas as pd # creating pandas Series object series = pd.Series([9,2,3,5,8,9,1,4,6]) print(series) # apply describe method print("output",series.describe())
解释
最初,我们使用 Python 整数列表创建了一个 Pandas 序列。并使用 describe() 方法分析了序列对象的统计信息。
输出
0 9 1 2 2 3 3 5 4 8 5 9 6 1 7 4 8 6 dtype: int64 Output count 9.000000 mean 5.222222 std 2.990726 min 1.000000 25% 3.000000 50% 5.000000 75% 8.000000 max 9.000000 dtype: float64
我们计算了数值序列对象的基线统计信息,结果显示在上面的输出块中。计数表示给定序列对象的元素数量。同样,我们分析了均值、最小值、最大值、标准差等。
示例 2
# importing required packages import pandas as pd # creating pandas Series object series = pd.Series(['A', 'B', 'E', 'C', 'A', 'D', 'D', 'E', 'F', 'C', 'B', 'A']) print(series) # apply describe method print("Output: ">"",series.describe())
解释
在以下示例中,我们计算了对象类型 Pandas 序列的统计信息。为此,我们使用字符串列表创建了一个序列对象。
输出
0 A 1 B 2 E 3 C 4 A 5 D 6 D 7 E 8 F 9 C 10 B 11 A dtype: object Output count 12 unique 6 top A freq 3 dtype: object
我们获得了序列元素的计数、唯一值的总数、最常出现(频率最高)的元素以及最常出现值的频率。
广告