Pandas DataFrame 中两个数字列之间的相关性
我们可以使用 pandas.DataFrame.corr 计算列的对相关性,排除空值。相关系数表示两个变量之间线性关联的强度。系数范围为 -1 ~ 1。
要获取 Pandas 数据框中两个数字列之间的相关性,我们可以采取以下步骤 -
- 设置图形大小并调整子图之间的和四周的填充。
- 创建二维大小可变,潜在异构表格数据的 Pandas 数据框。
- 比较两列的值,并使用 col1.corr(col2) 计算相关系数。
- 在控制台上打印相关系数。
- 若要显示图片,请使用 show() 方法。
示例
import pandas as pd
from matplotlib import pyplot as plt
plt.rcParams["figure.figsize"] = [7.00, 3.50]
plt.rcParams["figure.autolayout"] = True
df = pd.DataFrame({'lab': [1, 2, 3], 'value': [3, 4, 5]})
col1 = df['lab']
col2 = df['value']
plt.plot(col1, col2)
print("The correlation coefficient is: ", col1.corr(col2))
plt.show()输出
将产生以下输出
The correlation coefficient is: 1.0


在此,相关系数为 1.0,表示完全相关。因此,我们得到一条直线,因为所有点都位于一条直线上。
广告
数据结构
网络
RDBMS
操作系统
Java
iOS
HTML
CSS
Android
Python
C 编程
C++
C#
MongoDB
MySQL
Javascript
PHP