Pandas 中 series.describe 方法有什么作用?


pandas.series 中的 describe() 方法用于生成序列对象的统计描述。此方法分析数值和对象序列的描述。

因此,describe() 方法返回序列的汇总统计信息。它根据输入序列对象的类型而有所不同。

对于数值序列,describe() 方法分析基本统计信息,如计数、均值、标准差、最小值、最大值和分位数(25%、50% 和 75%)。50% 分位数与中位数相同。

如果序列对象包含对象类型数据,则 describe() 方法分析基本统计信息,如计数、唯一值、最常出现的值和频率。

示例 1

# importing required packages
import pandas as pd

# creating pandas Series object
series = pd.Series([9,2,3,5,8,9,1,4,6])
print(series)

# apply describe method
print("output",series.describe())

解释

最初,我们使用 Python 整数列表创建了一个 Pandas 序列。并使用 describe() 方法分析了序列对象的统计信息。

输出

0 9
1 2
2 3
3 5
4 8
5 9
6 1
7 4
8 6
dtype: int64

Output count  9.000000
mean 5.222222
std  2.990726
min  1.000000
25%  3.000000
50%  5.000000
75%  8.000000
max  9.000000
dtype: float64

我们计算了数值序列对象的基线统计信息,结果显示在上面的输出块中。计数表示给定序列对象的元素数量。同样,我们分析了均值、最小值、最大值、标准差等。

示例 2

# importing required packages
import pandas as pd

# creating pandas Series object
series = pd.Series(['A', 'B', 'E', 'C', 'A', 'D', 'D', 'E', 'F', 'C', 'B', 'A'])
print(series)

# apply describe method
print("Output: ">"",series.describe())

解释

在以下示例中,我们计算了对象类型 Pandas 序列的统计信息。为此,我们使用字符串列表创建了一个序列对象。

输出

0  A
1  B
2  E
3  C
4  A
5  D
6  D
7  E
8  F
9  C
10 B
11 A
dtype: object

Output count 12
unique 6
top    A
freq   3
dtype: object

我们获得了序列元素的计数、唯一值的总数、最常出现(频率最高)的元素以及最常出现值的频率。

更新于: 2022-03-09

530 次查看

开启你的 职业生涯

通过完成课程获得认证

开始学习
广告