Python 统计模块



Python 的Statistics 模块提供用于计算数学上真实数据的函数。Python 有一个内置模块;此函数支持 int、float、decimal 和 fractional。

如果您的输入数据包含混合数据类型,那么我们可以使用 map (float, input_data) 来确保一致的结果。

一些数据集使用 NaN(非数字)来表示缺失数据。NaN 具有不寻常的比较语义;它们会导致统计函数中令人惊讶或未定义的行为,这些函数对数据进行排序以计数出现次数。

平均值和集中趋势度量

这些函数从总体或样本中计算平均值或典型值。

序号 函数 & 描述
1

mean()

数据的算术平均值(“平均值”)。

2

fmean()

浮点算术平均值,可选加权。

3

geometric_mean()

数据的几何平均值。

4

harmonic_mean()

数据的调和平均值。

5

median()

数据的中间值(中间值)。

6

median_low()

数据的低中间值。

7

median_high()

数据的高中间值。

8

median_grouped()

分组数据的中间值(第 50 个百分位数)。

9

mode()

离散或名义数据的单个众数(最常见的值)。

10

multimode()

离散或名义数据的众数列表(最常见的值)。

11

quantiles()

将数据划分为概率相等的区间。

离散程度的度量

这些函数计算总体或样本偏离典型值或平均值的程度的度量。

序号 模块 & 描述
1

pstdev()

数据的总体标准差。

2

pvariance()

数据的总体方差。

3

stdev()

数据的样本标准差。

4

variance()

数据的样本方差。

两个输入之间关系的统计数据

这些函数计算关于两个输入之间关系的统计数据。

序号 模块 & 描述
1

covariance()

两个变量的样本协方差。

2

correlation()

皮尔逊相关系数 r 的取值范围为 -1 到 +1。

3

linear_regression()

简单线性回归的斜率和截距。

注意

这些函数不需要给定的数据进行排序。

python_modules.htm
广告