如何在 Pandas 中使用 Series.cov() 方法查找协方差?


Pandas 中的 Series.cov() 方法用于计算 Series 与其他 Series 的协方差,同时排除空值/NA 或缺失值。

协方差是一种计算两个随机变量之间关系的方法,它会告诉我们两个随机变量如何一起变化。

此 cov() 方法的输出是一个浮点值,表示两个 Series 之间的协方差。

此方法有三个参数,分别是 other、min_period 和 ddof。

示例 1

import pandas as pd
import numpy as np
# create pandas Series1
series1 = pd.Series([12,34,65,21])

print("First series object:",series1)

# create pandas Series2
series2 = pd.Series([9,78,62,12])

print("Second series object:",series2)

# calculate the covariance value
print("The covariance value: ", series1.cov(series2))

解释

我们使用整数列表初始化了两个 Pandas Series 对象 series1 和 series2,然后通过应用 cov() 方法计算了协方差。

输出

First series object:
0 12
1 34
2 65
3 21
dtype: int64

Second series object:
0  9
1 78
2 62
3 12
dtype: int64

The covariance value: 576.3333333333333

上面示例的协方差为 576.33,如上面输出块中所示。

示例 2

import pandas as pd
import numpy as np

# create pandas Series1
series1 = pd.Series([89,np.nan,74,91,100])

print("First series object:",series1)

# create pandas Series2
series2 = pd.Series([93,54,21,80,42])

print("Second series object:",series2)

# calculate the covariance value
print("The covariance value: ", series1.cov(series2, min_periods=3))

解释

在下面的示例中,我们计算了两个 Series 对象之间的协方差,这里给定 Series 对象的元素中存在 Nan 值。

输出

First series object:
0 89.0
1  NaN
2 74.0
3 91.0
4 100.0
dtype: float64

Second series object: 0 93
1 54
2 21
3 80
4 42
dtype: int64

The covariance value: 141.66666666666666

series.cov() 方法在计算 Series 之间的协方差时会排除 Nan 值。对于上面的示例,协方差为“141.666”。

更新于: 2022年3月9日

2K+ 次浏览

开启你的 职业生涯

通过完成课程获得认证

开始学习
广告