Seaborn.residplot() 方法



Seaborn.residplot() 方法用于绘制线性回归的残差数据。此函数将对变量 y 和 x 进行稳健或多项式回归,然后将残差绘制为散点图。如果您想查看残差是否具有任何结构,可以选择将低度局部多项式平滑拟合到残差图。

残差图是一种图形数据可视化工具,它将残差点绘制在 y 轴上,将自变量绘制在 x 轴上。此工具确定应用于点的回归模型是线性还是非线性。

语法

以下是 seaborn.residplot() 方法的语法:

seaborn.residplot(*, x=None, y=None, data=None, lowess=False, x_partial=None, y_partial=None, order=1, robust=False, dropna=True, label=None, color=None, scatter_kws=None, line_kws=None, ax=None

参数

下面讨论了 residplot() 方法的一些参数。

序号 参数及描述
1 x,y

这些参数接受变量名称作为输入,以绘制长格式数据。输入可以是向量或字符串。

2 data

这是用于绘制图形的数据框。

3 Lowess

此参数接受布尔值,并将低度局部多项式平滑拟合到残差散点图。

4 {x,y}_partial

此可选参数接受文本或矩阵作为输入。输入可以是数据中的列名,也可以是与 x 具有相同第一维度的矩阵。在绘制之前,这些变量被视为混杂因素,并从 x 或 y 变量中减去。

5 Order

此可选参数接受整数值,并确定在计算残差时要拟合的多项式的阶数。

6 Color

用于指定单个颜色,此颜色将应用于所有绘图元素。

7 robust

此可选参数接受布尔值,并在计算残差时拟合稳健线性回归。

8 dropna

它接受布尔值,如果为 True,则忽略具有缺失数据的值。

返回值

residplot() 方法返回带有已绘制点的 matplotlib 轴。

加载 seaborn 库

在继续开发绘图之前,让我们加载 seaborn 库和数据集。要加载或导入 seaborn 库,可以使用以下代码行。

Import seaborn as sns

加载数据集

在本文中,我们将使用 seaborn 库中内置的泰坦尼克号数据集。以下命令用于加载数据集。

titanic=sns.load_dataset("titanic")

以下命令用于查看数据集中前 5 行。这使我们能够了解可以使用哪些变量来绘制图形。

titanic.head()

以下是上述代码段的输出。

index,survived,pclass,sex,age,sibsp,parch,fare,embarked,class,who,adult_male,deck,embark_town,alive,alone
0,0,3,male,22.0,1,0,7.25,S,Third,man,true,NaN,Southampton,no,false
1,1,1,female,38.0,1,0,71.2833,C,First,woman,false,C,Cherbourg,yes,false
2,1,3,female,26.0,0,0,7.925,S,Third,woman,false,NaN,Southampton,yes,true

现在我们已经加载了数据集,我们将探索一些示例。

示例 1

我们将在本文中使用泰坦尼克号数据集,要绘制 residplot(),我们将数据集的 age 和 survived 列传递给 x,y 参数,并通过将 color 参数传递给 seaborn.residplot() 方法来更改绘图的颜色。在这种情况下,我们将字符串“g”传递给 color,这会将绘图更改为绿色。

import seaborn as sns
import matplotlib.pyplot as plt
titanic=sns.load_dataset("titanic")
titanic.head()
sns.residplot(y="survived", x="age",color="g",data=titanic)
plt.show()

输出

获得的输出如下:

Seaborn residplot method

示例 2

现在我们将了解 robust 参数的用法。此可选参数接受布尔值,并在计算残差时拟合稳健线性回归。此参数的使用方式如下所示。在下面的示例中,robust 传递了 True。

import seaborn as sns
import matplotlib.pyplot as plt
titanic=sns.load_dataset("titanic")
titanic.head()
sns.regplot(y="survived", x="age",color="g", robust=True,data=titanic)
plt.show()

输出

绘图输出如下:

residplot method

示例 3

Lowess 是 seaborn.residplot() 方法中另一个经常使用的参数。此参数接受布尔值,并将低度局部多项式平滑拟合到残差散点图。

由于我们将在本文中使用泰坦尼克号数据集,因此要绘制 residplot(),我们将分别将数据集的 age 和 survived 列传递给 x,y 参数。我们将布尔值 True 传递给 lowess 参数,并将颜色设置为红色,即:将字符串“r”传递给 color 属性,这会将绘图更改为红色。

可以在下面观察到该图。

import seaborn as sns
import matplotlib.pyplot as plt
titanic=sns.load_dataset("titanic")
titanic.head()
sns.regplot(y="survived", x="age",color="r", lowess=True,data=titanic)
plt.show()

输出

获得的绘图是:

residplot
seaborn_regression_plots_introduction.htm
广告