Seaborn.regplot() 方法



seaborn.regplot() 方法用于绘制数据并绘制线性回归模型拟合。有多种估计回归模型的选项,所有这些选项都是互斥的。

我们可能已经知道,回归分析是一种用于评估自变量和因变量之间关系的技术。因此,此模型用于创建回归图。

regplot() 和 lmplot() 函数比较接近,但 regplot() 方法是轴级函数,而另一个不是。包含该图的 Matplotlib 轴作为此方法的结果返回。

语法

以下是 seaborn.regplot() 方法的语法:

seaborn.regplot(*, x=None, y=None, data=None, x_estimator=None, x_bins=None, x_ci='ci', scatter=True, fit_reg=True, ci=95, n_boot=1000, units=None, seed=None, order=1, logistic=False, lowess=False, robust=False, logx=False, x_partial=None, y_partial=None, truncate=True, dropna=True, x_jitter=None, y_jitter=None, label=None, color=None, marker='o', scatter_kws=None, line_kws=None, ax=None)

参数

下面讨论了 regplot() 方法的一些参数。

序号 参数及描述
1 x,y

这些参数以变量名称作为输入,绘制长格式数据。

2 data

这是用于绘制图形的数据框。

3 x_estimator

这是一个可调用对象,它接受值并将向量映射到标量。这是一个可选参数。此函数应用于 x 的每个不同值,并绘制估计值为结果。当 x 是离散变量时,这很有帮助。如果提供了 x_ci,则此估计值将进行自举并绘制置信区间。

4 x_bins

此可选参数接受 int 或向量作为输入。x 变量被分成离散的箱,然后估计中心趋势和置信区间。

5 {x,y}_jitter

此可选参数接受浮点值。向 x 或 y 变量添加此大小的均匀随机噪声。

6 color

用于指定单一颜色,此颜色应用于所有绘图元素。

7 marker

这是用于在图中绘制数据点的标记。

8 x_ci

从 ci”、 “sd”、int in [0, 100] 或 None 中取值。这是一个可选参数。

传递给此参数的值确定在绘制离散 x 值的中心趋势时使用的置信区间的范围。

9 logx

接受布尔值,如果为 True,则在输入空间中绘制散点图和回归模型,同时还估计 y log(x) 类型的线性回归。为此工作,x 必须为正。

加载 seaborn 库

在继续开发绘图之前,让我们加载 seaborn 库和数据集。要加载或导入 seaborn 库,可以使用以下代码行。

Import seaborn as sns

加载数据集

在本文中,我们将使用 seaborn 库中内置的泰坦尼克号数据集。以下命令用于加载数据集。

titanic=sns.load_dataset("titanic")

以下命令用于查看数据集中前 5 行。这使我们能够理解哪些变量可以用于绘制图形。

titanic.head()

以下是上述代码段的输出。

index,survived,pclass,sex,age,sibsp,parch,fare,embarked,class,who,adult_male,deck,embark_town,alive,alone
0,0,3,male,22.0,1,0,7.25,S,Third,man,true,NaN,Southampton,no,false
1,1,1,female,38.0,1,0,71.2833,C,First,woman,false,C,Cherbourg,yes,false
2,1,3,female,26.0,0,0,7.925,S,Third,woman,false,NaN,Southampton,yes,true

现在我们已经加载了数据集,我们将探索一些示例。

示例 1

在此示例中,我们将通过获取内置数据集 titanic 并使用它来绘制简单的回归图。泰坦尼克号数据集的 fare 和 age 列分别传递给 x 和 y 参数。这里,这两列都是数值类型。此外,color 参数用于设置在图上绘制的数据点的颜色。在下面的代码中,传递了“g”,这意味着获得的图将具有绿色数据点。

import seaborn as sns
import matplotlib.pyplot as plt
titanic=sns.load_dataset("titanic")
titanic.head()
sns.regplot(x="fare", y="age",color="g", data=titanic)
plt.show()

输出

获得的图如下所示:

regplot method

示例 2

在此示例中,使用了 marker 参数。这是用于在图中绘制数据点的标记。在下面的示例中,传递的标记为“*”,因此获得的图将用“*”标记观测值。

import seaborn as sns
import matplotlib.pyplot as plt
titanic=sns.load_dataset("titanic")
titanic.head()
sns.regplot(y="fare", x="age",color="g", marker="*",data=titanic)
plt.show()

输出

获得的图如下所示。

Seaborn regplot method

示例 3

在此示例中,我们将了解 y_jitter 参数的工作原理。此可选参数接受浮点值,它向图的 x 或 y 变量添加此大小的均匀随机噪声。它可以在您的代码中使用,如下所示。

import seaborn as sns
import matplotlib.pyplot as plt
titanic=sns.load_dataset("titanic")
titanic.head()
sns.regplot(y="fare", x="age", y_jitter=.9,data=titanic)
plt.show()

输出

获得的输出图附在下面。

regplot

示例 4

现在,我们将了解 bins 参数的行为。此可选参数接受 int 或向量作为输入。x 变量被分成离散的箱,然后估计中心趋势和置信区间。在下面的示例中,将整数 5 传递给 x_bins 并观察输出。

import seaborn as sns
import matplotlib.pyplot as plt
titanic=sns.load_dataset("titanic")
titanic.head()
sns.regplot(y="fare", x="age",x_bins=5,data=titanic)
plt.show()

输出

生成的图形如下所示。

Seaborn regplot
seaborn_regression_plots_introduction.htm
广告

© . All rights reserved.