如何在MATLAB中计算协方差

MATLAB 数据分析编程

在本文中，我们将探讨**如何使用MATLAB编程计算协方差**。但在那之前，让我们先了解一下协方差的基本理论和重要性。

什么是协方差？

**协方差**是一种统计工具，用于描述两个或多个随机变量之间的相关性。换句话说，协方差是一种度量，它提供关于两个或多个变量之间关系的信息。

协方差主要用于量化一个变量相对于另一个变量的变化。

两个随机变量“A”和“B”之间的协方差指定为cov(A, B)，其计算方法如下：

$$\mathrm{cov(A,B)\:=\:\frac{1}{k}\displaystyle\sum\limits_{i=1}^k (a_i−E(A))(b_i−E(B))}$$

其中，E(A)和E(B)分别是随机变量A和B的期望值或均值。

协方差的值可以是正数、负数或零，它们代表随机变量之间不同类型的相关性或关系。

以下几点说明了根据协方差的值，随机变量之间关系的性质：

**正协方差** - 随机变量之间的正协方差值表示，当一个变量增加时，另一个变量也倾向于增加。因此，变量之间的正协方差表示它们之间存在正线性关系。
**负协方差** - 负协方差值表示，当一个变量增加时，第二个变量倾向于减少。因此，负协方差表示变量之间存在负线性关系。
**零协方差** - 当两个随机变量之间的协方差值为零时，表示变量之间不存在线性关系。但这并不意味着变量之间完全没有关系。它们可能存在非线性关系。

协方差广泛应用于统计学、数据分析和金融领域，因为它有助于分析和理解不同随机变量之间的关系，衡量它们的依赖性，估计风险和多样化等等。协方差也用于机器学习领域来分析和开发数据模型。

在简要概述了协方差之后，让我们现在讨论它在MATLAB编程中的实现。MATLAB提供了一个内置函数“cov()”，用于计算随机变量之间的协方差。

以下部分描述了MATLAB中“cov()”函数的不同语法及其在MATLAB编程中计算协方差的应用。

计算数组的协方差

以下语法用于计算数组的协方差并获得协方差矩阵

C = cov(X);

以下程序演示了此语法的实现。

示例

% MATLAB code to calculate covariance of an array
% Define an array
X = [2 4 6; 8 10 12; 14 16 18];
% Calculate covariance of the array
C = cov(X);
% Display the covariance result
disp('The covariance of the array X is:');
disp(C);

输出

The covariance of the array X is:
   36   36   36
   36   36   36
   36   36   36

代码解释

在这个MATLAB程序中，我们首先定义一个数组“X”。然后，我们使用“cov”函数计算其协方差并将结果存储在“C”变量中。最后，我们使用“disp”函数显示结果。

计算两个数组的协方差

要计算两个数组的协方差，我们使用“cov”函数的以下语法

C = cov(X, Y);

让我们了解一下在MATLAB编程中此语法的实现。

示例

% MATLAB code to calculate covariance of two arrays
% Define two input arrays
X = [2 4 6; -3 5 7];
Y = [8 10 12; 2 -7 6];
% Calculate covariance of arrays
C = cov(X, Y);
% Display the covariance result
disp('The covariance of the arrays X and Y is:');
disp(C);

输出

The covariance of the arrays X and Y is:
   15.0000   42.5000   15.0000
   -3.0000   -8.5000   -3.0000
   -3.0000   -8.5000   -3.0000

通过归一化计算数组的协方差

“cov”函数的以下语法用于通过用权重“W”归一化来计算数组的协方差

C = cov(X, W);

这里，如果W = 1，则协方差矩阵按“输入数组的行数”进行归一化；如果W = 0，则协方差矩阵按“输入数组的行数减1”进行归一化。

以下MATLAB程序演示了此语法的实现。

示例

% MATLAB code to calculate covariance of an array with normalization
% Define the input array
X = [2 4 6; 3 5 7; 9 8 5];
% Calculate covariance of array with normalization by W = 1
C1 = cov(X, 1);
% Calculate covariance of array with normalization by W = 0
C2 = cov(X, 0);
% Display the covariance result
disp('The covariance of the array X with W = 1 is:');
disp(C1);
disp('The covariance of the array X with W = 0 is:');
disp(C2);

输出

The covariance of the array X with W = 1 is:
    9.5556    5.2222   -2.0000
    5.2222    2.8889   -1.0000
   -2.0000   -1.0000    0.6667

The covariance of the array X with W = 0 is:
   14.3333    7.8333   -3.0000
    7.8333    4.3333   -1.5000
   -3.0000   -1.5000    1.0000

代码解释

在这个MATLAB代码中，我们首先定义一个数组“X”。然后，我们通过用“W = 1”和“W = 0”对其进行归一化来计算“X”的协方差，并将结果分别存储在“C1”和“C2”中。最后，我们使用“disp”函数显示协方差矩阵。

计算包含NaN值的数组的协方差

当给定数组包含NaN值时，我们使用“cov”函数的以下语法来计算数组的协方差

C = cov(X, nanflag);

这里，“nanflag”选项指定了如何在协方差计算中处理数组的NaN值。

如果nanflag = 'includenan'，则“cov”函数会在计算中考虑数组的NaN值。

如果nanflag = 'omitrows'，则“cov”函数会在计算中忽略NaN值。

以下MATLAB程序演示了使用带“nanflag”选项的“cov”函数。

示例

% MATLAB code to calculate covariance of an array with nanflag option
% Define the input array with NaN values
X = [2 4 5; 3 5 7; NaN 7 NaN];
% Calculate covariance of array with includenan flag
C1 = cov(X, 'includenan');
% Calculate covariance of array with omitrows flag
C2 = cov(X, 'omitrows');
% Display the covariance results
disp('The covariance of the array with includenan is:');
disp(C1);
disp('The covariance of the array with omitrows is:');
disp(C2);

输出

The covariance of the array with includenan is:
       NaN       NaN       NaN
       NaN    2.3333       NaN
       NaN       NaN       NaN

The covariance of the array with omitrows is:
    0.5000    0.5000    1.0000
    0.5000    0.5000    1.0000
    1.0000    1.0000    2.0000

代码解释

在这个MATLAB程序中，我们首先定义一个包含NaN值的数组“X”。然后，我们计算“X”的协方差，包括NaN值和忽略NaN值，并将结果分别存储在“C1”和“C2”中。最后，我们使用“disp”函数显示协方差矩阵。

Saini Manish Kumar

更新于：2023年8月7日

225 次浏览

启动您的职业生涯

通过完成课程获得认证

开始