- Seaborn 教程
- Seaborn - 首页
- Seaborn - 简介
- Seaborn - 环境设置
- 导入数据集和库
- Seaborn - 图形美观
- Seaborn - 调色板
- Seaborn - 直方图
- Seaborn - 核密度估计
- 可视化成对关系
- Seaborn - 绘制分类数据
- 观测值的分布
- Seaborn - 统计估计
- Seaborn - 绘制宽格式数据
- 多面板分类图
- Seaborn - 线性关系
- Seaborn - Facet Grid
- Seaborn - Pair Grid
- 函数参考
- Seaborn - 函数参考
- Seaborn 有用资源
- Seaborn - 快速指南
- Seaborn - 有用资源
- Seaborn - 讨论
Seaborn.regplot() 方法
seaborn.regplot() 方法用于绘制数据并绘制线性回归模型拟合。有多种估计回归模型的选项,所有这些选项都是互斥的。
我们可能已经知道,回归分析是一种用于评估自变量和因变量之间关系的技术。因此,此模型用于创建回归图。
regplot() 和 lmplot() 函数比较接近,但 regplot() 方法是轴级函数,而另一个不是。包含该图的 Matplotlib 轴作为此方法的结果返回。
语法
以下是 seaborn.regplot() 方法的语法:
seaborn.regplot(*, x=None, y=None, data=None, x_estimator=None, x_bins=None, x_ci='ci', scatter=True, fit_reg=True, ci=95, n_boot=1000, units=None, seed=None, order=1, logistic=False, lowess=False, robust=False, logx=False, x_partial=None, y_partial=None, truncate=True, dropna=True, x_jitter=None, y_jitter=None, label=None, color=None, marker='o', scatter_kws=None, line_kws=None, ax=None)
参数
下面讨论了 regplot() 方法的一些参数。
| 序号 | 参数及描述 |
|---|---|
| 1 | x,y 这些参数以变量名称作为输入,绘制长格式数据。 |
| 2 | data 这是用于绘制图形的数据框。 |
| 3 | x_estimator 这是一个可调用对象,它接受值并将向量映射到标量。这是一个可选参数。此函数应用于 x 的每个不同值,并绘制估计值为结果。当 x 是离散变量时,这很有帮助。如果提供了 x_ci,则此估计值将进行自举并绘制置信区间。 |
| 4 | x_bins 此可选参数接受 int 或向量作为输入。x 变量被分成离散的箱,然后估计中心趋势和置信区间。 |
| 5 | {x,y}_jitter 此可选参数接受浮点值。向 x 或 y 变量添加此大小的均匀随机噪声。 |
| 6 | color 用于指定单一颜色,此颜色应用于所有绘图元素。 |
| 7 | marker 这是用于在图中绘制数据点的标记。 |
| 8 | x_ci 从 ci”、 “sd”、int in [0, 100] 或 None 中取值。这是一个可选参数。 传递给此参数的值确定在绘制离散 x 值的中心趋势时使用的置信区间的范围。 |
| 9 | logx 接受布尔值,如果为 True,则在输入空间中绘制散点图和回归模型,同时还估计 y log(x) 类型的线性回归。为此工作,x 必须为正。 |
加载 seaborn 库
在继续开发绘图之前,让我们加载 seaborn 库和数据集。要加载或导入 seaborn 库,可以使用以下代码行。
Import seaborn as sns
加载数据集
在本文中,我们将使用 seaborn 库中内置的泰坦尼克号数据集。以下命令用于加载数据集。
titanic=sns.load_dataset("titanic")
以下命令用于查看数据集中前 5 行。这使我们能够理解哪些变量可以用于绘制图形。
titanic.head()
以下是上述代码段的输出。
index,survived,pclass,sex,age,sibsp,parch,fare,embarked,class,who,adult_male,deck,embark_town,alive,alone 0,0,3,male,22.0,1,0,7.25,S,Third,man,true,NaN,Southampton,no,false 1,1,1,female,38.0,1,0,71.2833,C,First,woman,false,C,Cherbourg,yes,false 2,1,3,female,26.0,0,0,7.925,S,Third,woman,false,NaN,Southampton,yes,true
现在我们已经加载了数据集,我们将探索一些示例。
示例 1
在此示例中,我们将通过获取内置数据集 titanic 并使用它来绘制简单的回归图。泰坦尼克号数据集的 fare 和 age 列分别传递给 x 和 y 参数。这里,这两列都是数值类型。此外,color 参数用于设置在图上绘制的数据点的颜色。在下面的代码中,传递了“g”,这意味着获得的图将具有绿色数据点。
import seaborn as sns
import matplotlib.pyplot as plt
titanic=sns.load_dataset("titanic")
titanic.head()
sns.regplot(x="fare", y="age",color="g", data=titanic)
plt.show()
输出
获得的图如下所示:
示例 2
在此示例中,使用了 marker 参数。这是用于在图中绘制数据点的标记。在下面的示例中,传递的标记为“*”,因此获得的图将用“*”标记观测值。
import seaborn as sns
import matplotlib.pyplot as plt
titanic=sns.load_dataset("titanic")
titanic.head()
sns.regplot(y="fare", x="age",color="g", marker="*",data=titanic)
plt.show()
输出
获得的图如下所示。
示例 3
在此示例中,我们将了解 y_jitter 参数的工作原理。此可选参数接受浮点值,它向图的 x 或 y 变量添加此大小的均匀随机噪声。它可以在您的代码中使用,如下所示。
import seaborn as sns
import matplotlib.pyplot as plt
titanic=sns.load_dataset("titanic")
titanic.head()
sns.regplot(y="fare", x="age", y_jitter=.9,data=titanic)
plt.show()
输出
获得的输出图附在下面。
示例 4
现在,我们将了解 bins 参数的行为。此可选参数接受 int 或向量作为输入。x 变量被分成离散的箱,然后估计中心趋势和置信区间。在下面的示例中,将整数 5 传递给 x_bins 并观察输出。
import seaborn as sns
import matplotlib.pyplot as plt
titanic=sns.load_dataset("titanic")
titanic.head()
sns.regplot(y="fare", x="age",x_bins=5,data=titanic)
plt.show()
输出
生成的图形如下所示。