regplot()、lmplot() 和 residplot() 之间的区别?
Seaborn是一个基于matplotlib的Python数据可视化包。它提供了一个高级绘图工具,用于创建引人注目且具有教育意义的统计可视化效果。Seaborn帮助解决了Matplotlib的两个主要问题,它们是?
我们现在认为,教学生如何使用ggplot2的方法(需要更多代码,但更高级、更灵活、更透明)来生成这些表示形式将对学生有益。在这里,我们将使用ggplot2重建residPlot()生成的 basic plots,作为帮助用户从residPlot()切换到ggplot2的资源。
功能 |
regplot() |
lmplot() |
residplot() |
---|---|---|---|
用途 |
绘制两个变量之间的简单线性回归模型 |
绘制线性回归模型,同时根据另一个变量对一个变量进行分组 |
绘制线性回归模型的残差 |
可视化 |
散点图,带有回归线和置信区间 |
散点图,带有回归线和置信区间,能够根据另一个变量对一个变量进行分组 |
残差的散点图,带有零参考线 |
实用性 |
用于快速可视化两个变量之间的关系和线性回归模型拟合 |
用于可视化两个变量之间的关系和线性回归模型拟合,同时考虑第三个变量的影响 |
用于可视化线性回归模型的残差并检查残差中的模式或结构 |
回归模型 |
简单线性回归模型 |
线性回归模型 |
线性回归模型 |
输出 |
散点图,带有回归线和置信区间 |
散点图,带有回归线和置信区间,按第三个变量分组 |
残差的散点图,带有零参考线 |
seaborn.regplot()
seaborn.regplot() 函数用于绘制数据和线性回归模型的拟合。有多种估计回归模型的方法,它们是互斥的。
语法
seaborn.regplot( x, y, data=None, x_estimator=None, x_bins=None, x_ci=’ci’, scatter=True, fit_reg=True, ci=95, n_boot=1000, units=None, order=1, logistic=False, lowess=False, robust=False, logx=False, x_partial=None, y_partial=None, truncate=False, dropna=True, x_jitter=None, y_jitter=None, label=None, color=None, marker=’o’, scatter_kws=None, line_kws=None, ax=None)
参数 - 下面是一些关键参数的描述 -
x, y - 这些是输入变量。如果为字符串,则应与“data”部分中的列名匹配。使用 pandas 对象时,轴将显示系列名称。
data - 这是一个数据框,其中每一行代表一个观测值,每一列代表一个变量。
lowess - 此参数接受布尔值,并且是可选的。如果为“True”,则使用“statsmodels”(局部加权线性回归)估计非参数 Lowess 模型。
color - 应用于所有叙述部分的颜色。
marker - (可选)散点图标记要使用的 glyph。
返回值 - 包含绘图的 Axes 对象。
seaborn.Implot()
Seaborn 库中的 seaborn.lmplot() 函数用于可视化两个数值变量之间的关系。它创建一个散点图并对数据拟合线性回归模型。它是一种方便的方式来可视化变量和回归模型之间的关系,也可以用于比较不同组或类别的变量之间的关系。
以下是如何在 Python 中使用 lmplot() 函数的示例 -
import seaborn as sns # Load the data df = sns.load_dataset('titanic') # Create an lmplot with fare and age as the x and y variables, and class as the hue sns.lmplot(x='fare', y='age', hue='class', data=df) # Show the plot plt.show()
这将创建一个散点图,并对数据拟合线性回归模型,并按 class 列对点着色。
lmplot() 函数有几个参数,可用于自定义绘图的外观和行为。一些主要参数是 -
x - 用作 x 变量的列名。
y - 用作 y 变量的列名。
hue - 用于对点着色的列名。
data - 用于绘图的数据框。
col - 列名,为每个唯一值创建子图。
row - 列名,为每个唯一值创建子图。
fit_reg - 布尔值,指示是否对数据拟合线性回归模型。
scatter_kws - 传递给 scatter() 函数的关键字参数字典。
line_kws - 传递给 plot() 函数的关键字参数字典。
返回值 - 此方法返回带有绘图的 FacetGrid 对象,以便进一步调整
seaborn.residplot()
语法
seaborn.residplot(x, y, data=None, lowess=False, x_partial=None, y_partial=None, order=1, robust=False, dropna=True, label=None, color=None, scatter_kws=None, line_kws=None, ax=None)
参数 - 下面给出一些主要参数的描述 -
x - “data”部分中预测变量的数据或列名。
y - “data”部分中响应变量的数据或列名。
data - 包含“x”和“y”列的数据框。
lowess - (可选)用 lowess 平滑器拟合残差散点图。
dropna - 此参数是可选的,它接受布尔值。如果为 True,则在拟合和绘图时,忽略具有缺失数据的值。
结论
总之,regplot()、lmplot() 和 residplot() 是 Python 库 Seaborn 中用于创建回归图的函数。这些图用于可视化两个变量之间的关系以及该关系的强度。
Regplot() 是一个绘制数据的散点图并对数据拟合线性回归模型的函数。它允许您指定 x 和 y 变量、数据以及各种自定义选项,例如点的颜色、大小和样式。
Lmplot() 是一个将 regplot() 与 facet 绘图结合的函数,允许您在一个图形中绘制多个回归图。它允许您指定 x 和 y 变量、数据以及 hue、col 和 row 变量来创建 facet 绘图。它还允许您指定各种自定义选项,例如点的颜色、大小和样式。
Residplot() 是一个绘制线性回归模型残差的函数。它允许您指定 x 和 y 变量、数据以及各种自定义选项,例如点的颜色、大小和样式。