regplot()、lmplot() 和 residplot() 之间的区别?


Seaborn是一个基于matplotlib的Python数据可视化包。它提供了一个高级绘图工具,用于创建引人注目且具有教育意义的统计可视化效果。Seaborn帮助解决了Matplotlib的两个主要问题,它们是?

我们现在认为,教学生如何使用ggplot2的方法(需要更多代码,但更高级、更灵活、更透明)来生成这些表示形式将对学生有益。在这里,我们将使用ggplot2重建residPlot()生成的 basic plots,作为帮助用户从residPlot()切换到ggplot2的资源。

功能

regplot()

lmplot()

residplot()

用途

绘制两个变量之间的简单线性回归模型

绘制线性回归模型,同时根据另一个变量对一个变量进行分组

绘制线性回归模型的残差

可视化

散点图,带有回归线和置信区间

散点图,带有回归线和置信区间,能够根据另一个变量对一个变量进行分组

残差的散点图,带有零参考线

实用性

用于快速可视化两个变量之间的关系和线性回归模型拟合

用于可视化两个变量之间的关系和线性回归模型拟合,同时考虑第三个变量的影响

用于可视化线性回归模型的残差并检查残差中的模式或结构

回归模型

简单线性回归模型

线性回归模型

线性回归模型

输出

散点图,带有回归线和置信区间

散点图,带有回归线和置信区间,按第三个变量分组

残差的散点图,带有零参考线

seaborn.regplot()

seaborn.regplot() 函数用于绘制数据和线性回归模型的拟合。有多种估计回归模型的方法,它们是互斥的。

语法

seaborn.regplot( x,  y,  data=None, x_estimator=None, x_bins=None,  
x_ci=’ci’, scatter=True, fit_reg=True, ci=95, n_boot=1000, units=None, 
order=1, logistic=False, lowess=False, robust=False, logx=False, 
x_partial=None, y_partial=None, truncate=False, dropna=True, 
x_jitter=None, y_jitter=None, label=None, color=None, marker=’o’,   
scatter_kws=None, line_kws=None, ax=None)

参数 - 下面是一些关键参数的描述 -

  • x, y - 这些是输入变量。如果为字符串,则应与“data”部分中的列名匹配。使用 pandas 对象时,轴将显示系列名称。

  • data - 这是一个数据框,其中每一行代表一个观测值,每一列代表一个变量。

  • lowess - 此参数接受布尔值,并且是可选的。如果为“True”,则使用“statsmodels”(局部加权线性回归)估计非参数 Lowess 模型。

  • color - 应用于所有叙述部分的颜色。

  • marker - (可选)散点图标记要使用的 glyph。

返回值 - 包含绘图的 Axes 对象。

seaborn.Implot()

Seaborn 库中的 seaborn.lmplot() 函数用于可视化两个数值变量之间的关系。它创建一个散点图并对数据拟合线性回归模型。它是一种方便的方式来可视化变量和回归模型之间的关系,也可以用于比较不同组或类别的变量之间的关系。

以下是如何在 Python 中使用 lmplot() 函数的示例 -

import seaborn as sns
# Load the data
df = sns.load_dataset('titanic')
# Create an lmplot with fare and age as the x and y variables, and class as the hue
sns.lmplot(x='fare', y='age', hue='class', data=df)
# Show the plot
plt.show()

这将创建一个散点图,并对数据拟合线性回归模型,并按 class 列对点着色。

lmplot() 函数有几个参数,可用于自定义绘图的外观和行为。一些主要参数是 -

  • x - 用作 x 变量的列名。

  • y - 用作 y 变量的列名。

  • hue - 用于对点着色的列名。

  • data - 用于绘图的数据框。

  • col - 列名,为每个唯一值创建子图。

  • row - 列名,为每个唯一值创建子图。

  • fit_reg - 布尔值,指示是否对数据拟合线性回归模型。

  • scatter_kws - 传递给 scatter() 函数的关键字参数字典。

  • line_kws - 传递给 plot() 函数的关键字参数字典。

返回值 - 此方法返回带有绘图的 FacetGrid 对象,以便进一步调整

seaborn.residplot()

语法

seaborn.residplot(x, y, data=None, lowess=False, x_partial=None, y_partial=None, order=1,
   robust=False, dropna=True, label=None, color=None, scatter_kws=None, line_kws=None, ax=None)

参数 - 下面给出一些主要参数的描述 -

  • x - “data”部分中预测变量的数据或列名。

  • y - “data”部分中响应变量的数据或列名。

  • data - 包含“x”和“y”列的数据框。

  • lowess - (可选)用 lowess 平滑器拟合残差散点图。

  • dropna - 此参数是可选的,它接受布尔值。如果为 True,则在拟合和绘图时,忽略具有缺失数据的值。

结论

总之,regplot()、lmplot() 和 residplot() 是 Python 库 Seaborn 中用于创建回归图的函数。这些图用于可视化两个变量之间的关系以及该关系的强度。

Regplot() 是一个绘制数据的散点图并对数据拟合线性回归模型的函数。它允许您指定 x 和 y 变量、数据以及各种自定义选项,例如点的颜色、大小和样式。

Lmplot() 是一个将 regplot() 与 facet 绘图结合的函数,允许您在一个图形中绘制多个回归图。它允许您指定 x 和 y 变量、数据以及 hue、col 和 row 变量来创建 facet 绘图。它还允许您指定各种自定义选项,例如点的颜色、大小和样式。

Residplot() 是一个绘制线性回归模型残差的函数。它允许您指定 x 和 y 变量、数据以及各种自定义选项,例如点的颜色、大小和样式。

更新于:2023年5月5日

787 次浏览

开启您的职业生涯

完成课程获得认证

开始学习
广告