计算给定 NumPy 数组的均值、标准差和方差


均值、标准差和方差是用于描述给定数据集数据分布的统计量度。在 Numpy 库中,我们有函数可以计算数组的均值、标准差和方差。让我们逐一详细了解。

均值

均值也称为平均值,它是数组中所有元素的总和除以元素总数。它用于表示数据的集中趋势。

语法

以下是将均值函数应用于数组的语法:

numpy.mean(arr)

其中

  • Numpy 是库。

  • mean 是函数。

  • arr 是输入数组。

示例

在以下示例中,我们使用mean()函数计算给定输入一维数组的均值。

import numpy as np
a = np.array([22,1,7,14,5,2])
print("The input array:",a)
mean_array = np.mean(a)
print("The mean of the given input array:",mean_array)

输出

以下是给定输入数组的均值输出。

The input array: [22 1 7 14 5 2]
The mean of the given input array: 8.5

示例

让我们再看一个使用 NumPy 数组的 mean() 函数计算二维数组均值的示例。

import numpy as np
a = np.array([[34,23],[90,34],[43,23],[10,34]])
print("The input array:",a)
mean_array = np.mean(a)
print("The mean of the given input 2-d array:",mean_array)

输出

以下是运行代码时上述代码的输出:

The input array: [[34 23]
 [90 34]
 [43 23]
 [10 34]]
The mean of the given input 2-d array: 36.375

示例

在这里,我们使用 NumPy 数组的 mean() 函数计算三维数组的均值。

import numpy as np
a = np.array([[[34,23],[90,34]],[[43,23],[10,34]]])
print("The input array:",a)
mean_array = np.mean(a)
print("The mean of the given input 3-d array:",mean_array)

输出

The input array: [[[34 23]
  [90 34]]

 [[43 23]
  [10 34]]]
The mean of the given input 3-d array: 36.375

方差

这用于查找数据在给定数据集中是如何分布的。它是通过计算每个数据点与其均值平方差的平均值来计算的。从数学上讲,查找方差的公式如下所示。

Variance = (1/n) * sum((xi - mean)2)

其中,

  • n 是数据点的数量。

  • xi 是给定数据的第 i 个数据点。

  • mean 是给定数据的平均值

  • 高方差

高方差

高方差表示数据值分布在较大的范围内,而低方差表示值聚集在数据值的均值周围。在 Numpy 中,我们有 var() 函数来计算给定数组的方差。

语法

以下是将方差函数用于数组的语法。

numpy.var(arr)

其中,

  • Numpy 是库。

  • var 是函数。

  • arr 是输入数组。

示例

在以下示例中,我们尝试使用 numpy 的 var() 函数计算一维数组的方差:

import numpy as np
a = np.array([2,7,50,3,12])
print("The input array:",a)
variance = np.var(a)
print("The variance of the given input 1-d array:", variance)

输出

The input array: [ 2  7 50  3 12]
The variance of the given input 1-d array: 322.16

示例

让我们再看一个使用 var() 函数计算二维数组方差的示例。

import numpy as np
a = np.array([[90,34],[43,23]])
print("The input array:",a)
variance = np.var(a)
print("The variance of the given input 2-d array:",variance)

输出

The input array: [[90 34]
 [43 23]]
The variance of the given input 2-d array: 652.25

标准差

标准差定义了数据与均值之间分布的度量,并告诉我们数据与均值之间的偏差程度。此方法的数学公式如下。

Standard deviation = √(Σ(xi - x)2 / (n - 1))

其中,

  • n 是数据点的数量。

  • Σ(xi - x)2 是每个数据值与均值之间平方差的总和。

使用 Python 计算标准差

在 python 的 statistics 模块中,我们有名为 stdev() 的函数来查找给定数组的标准差。

示例

在以下示例中,我们尝试通过将一维数组传递给 stdev() 函数来计算数组的标准差:

import statistics
import numpy as np
a = np.array([34,23,90,34,90,34,43,23])
print("The input array:",a)
std = statistics.stdev(a)
print("The standard deviation of the given input 1-d array:",std)

输出

以下是为给定输入数组计算的标准差输出。

The input array: [34 23 90 34 90 34 43 23]
The standard deviation of the given input 1-d array: 27.694764848252458

更新于:2023 年 8 月 7 日

327 次查看

启动您的 职业生涯

通过完成课程获得认证

开始
广告