计算给定 NumPy 数组的均值、标准差和方差
均值、标准差和方差是用于描述给定数据集数据分布的统计量度。在 Numpy 库中,我们有函数可以计算数组的均值、标准差和方差。让我们逐一详细了解。
均值
均值也称为平均值,它是数组中所有元素的总和除以元素总数。它用于表示数据的集中趋势。
语法
以下是将均值函数应用于数组的语法:
numpy.mean(arr)
其中
Numpy 是库。
mean 是函数。
arr 是输入数组。
示例
在以下示例中,我们使用mean()函数计算给定输入一维数组的均值。
import numpy as np a = np.array([22,1,7,14,5,2]) print("The input array:",a) mean_array = np.mean(a) print("The mean of the given input array:",mean_array)
输出
以下是给定输入数组的均值输出。
The input array: [22 1 7 14 5 2]
The mean of the given input array: 8.5
示例
让我们再看一个使用 NumPy 数组的 mean() 函数计算二维数组均值的示例。
import numpy as np a = np.array([[34,23],[90,34],[43,23],[10,34]]) print("The input array:",a) mean_array = np.mean(a) print("The mean of the given input 2-d array:",mean_array)
输出
以下是运行代码时上述代码的输出:
The input array: [[34 23] [90 34] [43 23] [10 34]] The mean of the given input 2-d array: 36.375
示例
在这里,我们使用 NumPy 数组的 mean() 函数计算三维数组的均值。
import numpy as np a = np.array([[[34,23],[90,34]],[[43,23],[10,34]]]) print("The input array:",a) mean_array = np.mean(a) print("The mean of the given input 3-d array:",mean_array)
输出
The input array: [[[34 23] [90 34]] [[43 23] [10 34]]] The mean of the given input 3-d array: 36.375
方差
这用于查找数据在给定数据集中是如何分布的。它是通过计算每个数据点与其均值平方差的平均值来计算的。从数学上讲,查找方差的公式如下所示。
Variance = (1/n) * sum((xi - mean)2)
其中,
n 是数据点的数量。
xi 是给定数据的第 i 个数据点。
mean 是给定数据的平均值
高方差
高方差
高方差表示数据值分布在较大的范围内,而低方差表示值聚集在数据值的均值周围。在 Numpy 中,我们有 var() 函数来计算给定数组的方差。
语法
以下是将方差函数用于数组的语法。
numpy.var(arr)
其中,
Numpy 是库。
var 是函数。
arr 是输入数组。
示例
在以下示例中,我们尝试使用 numpy 的 var() 函数计算一维数组的方差:
import numpy as np a = np.array([2,7,50,3,12]) print("The input array:",a) variance = np.var(a) print("The variance of the given input 1-d array:", variance)
输出
The input array: [ 2 7 50 3 12] The variance of the given input 1-d array: 322.16
示例
让我们再看一个使用 var() 函数计算二维数组方差的示例。
import numpy as np a = np.array([[90,34],[43,23]]) print("The input array:",a) variance = np.var(a) print("The variance of the given input 2-d array:",variance)
输出
The input array: [[90 34] [43 23]] The variance of the given input 2-d array: 652.25
标准差
标准差定义了数据与均值之间分布的度量,并告诉我们数据与均值之间的偏差程度。此方法的数学公式如下。
Standard deviation = √(Σ(xi - x)2 / (n - 1))
其中,
n 是数据点的数量。
Σ(xi - x)2 是每个数据值与均值之间平方差的总和。
使用 Python 计算标准差
在 python 的 statistics 模块中,我们有名为 stdev() 的函数来查找给定数组的标准差。
示例
在以下示例中,我们尝试通过将一维数组传递给 stdev() 函数来计算数组的标准差:
import statistics import numpy as np a = np.array([34,23,90,34,90,34,43,23]) print("The input array:",a) std = statistics.stdev(a) print("The standard deviation of the given input 1-d array:",std)
输出
以下是为给定输入数组计算的标准差输出。
The input array: [34 23 90 34 90 34 43 23] The standard deviation of the given input 1-d array: 27.694764848252458