- Seaborn 教程
- Seaborn - 首页
- Seaborn - 简介
- Seaborn - 环境设置
- 导入数据集和库
- Seaborn - 图形美观
- Seaborn - 调色板
- Seaborn - 直方图
- Seaborn - 核密度估计
- 可视化成对关系
- Seaborn - 绘制分类数据
- 观测值的分布
- Seaborn - 统计估计
- Seaborn - 绘制宽格式数据
- 多面板分类图
- Seaborn - 线性关系
- Seaborn - Facet Grid
- Seaborn - Pair Grid
- 函数参考
- Seaborn - 函数参考
- Seaborn 有用资源
- Seaborn - 快速指南
- Seaborn - 有用资源
- Seaborn - 讨论
Seaborn.kdeplot() 方法
Seaborn.kdeplot() 方法有助于使用核密度估计绘制单变量或双变量分布。
与直方图类似,核密度估计图是一种显示数据集观测值分布的技术。核密度估计 (KDE) 使用一维或多维的连续概率密度曲线来描述数据。
语法
以下是 Seaborn.kdeplot() 方法的语法
Seaborn.kdeplot(x=None, *, y=None, shade=None, vertical=False, kernel=None, bw=None, gridsize=200, cut=3, clip=None, legend=True, cumulative=False, shade_lowest=None, cbar=False, cbar_ax=None, cbar_kws=None, ax=None, weights=None, hue=None, palette=None, hue_order=None, hue_norm=None, multiple='layer', common_norm=True, common_grid=False, levels=10, thresh=0.05, bw_method='scott', bw_adjust=1, log_scale=None, color=None, fill=None, data=None, data2=None, warn_singular=True, **kwargs)
参数
下面讨论了 seaborn.kdeplot() 方法的一些参数。
序号 | 参数及描述 |
---|---|
1 | x,y 在 x、y 轴上表示的变量。 |
2 | Hue 这将生成具有不同颜色的元素。它是一个分组变量。 |
3 | Levels 此参数用于指定在图中绘制轮廓的级别数。 |
4 | Cmap Cmap 或颜色映射用于指定用于绘制地图的颜色。采用不同类型的值,例如 blues、greens、PiYg 等。 |
5 | Bw_adjust 采用数值,并随着传递的值增加而使绘制的曲线变得平滑。 |
6 | Thresh 用于指定绘制轮廓的最低级别。取值为 0 到 1。 |
7 | Cumulative 绘制累积计数,随着箱数的增加。 |
8 | Multiple 与单变量数据相关,并取值:stacked、layer 和 fill。 |
9 | Log_scale 将轴刻度设置为对数,并以对数刻度绘制所绘制的值。 |
10 | Legend 布尔值。如果为假,则不打印语义变量的图例。 |
让我们在继续绘制图形之前加载 Seaborn 库和数据集。
加载 Seaborn 库
要加载或导入 Seaborn 库,可以使用以下代码行。
Import seaborn as sns
需要哪种数据?
需要双变量数据才能理解 kdeplot() 方法中包含的大多数参数。尽管此方法提供了绘制单变量数据 kdeplot() 的方法,但它具有更多参数来绘制双变量数据,因此考虑使用 flights 数据集,因为它包含双变量数据。
(双变量数据意味着数据依赖于多个变量,而单变量数据意味着数据仅依赖于一个变量。)
加载数据集
在本文中,我们将使用 seaborn 库中内置的 flights 数据集。以下命令用于加载数据集。
flights=sns.load_dataset("flights")
以下命令用于查看数据集中前 5 行。这使我们能够了解可以使用哪些变量来绘制图形。
flights.head()
以下是上述代码段的输出。
index,year,month,passengers 0,1949,Jan,112 1,1949,Feb,118 2,1949,Mar,132 3,1949,Apr,129 4,1949,May,121
现在我们已经加载了数据,我们将继续绘制数据。
示例 1
在此示例中,我们将了解如何使用 seaborn.kdeplot() 方法为宽格式数据集中的每一列绘制核密度估计。为此,可以使用以下代码行。
import seaborn as sns import matplotlib.pyplot as plt flights=sns.load_dataset("flights") flights.head() sns.kdeplot(data=flights) plt.show()
输出
上述代码的输出图形如下所示。
示例 2
现在,我们将了解如何为给定数据集绘制基本 kdeplot。
import seaborn as sns import matplotlib.pyplot as plt flights=sns.load_dataset("flights") flights.head() sns.kdeplot(data=flights, x="year", y="passengers") plt.show()
输出
上述代码片段的输出图如下所示。
示例 3
在此示例中,我们将了解如何使用 fill 参数。因此,此参数用于填充定义的图形轮廓中的颜色。在下面的代码中,考虑了 x、y 和 hue 参数,并且由于将 True 传递给 fil 参数,因此获得的图形填充了颜色。
import seaborn as sns import matplotlib.pyplot as plt flights=sns.load_dataset("flights") flights.head() sns.kdeplot(data=flights, x="year", y="passengers",fill=True,hue="month") plt.show()
输出
上述代码片段的输出如下所示:
如上所述,此处填充了图形的轮廓。
示例 4
我们将在本示例中了解 levels 参数。Levels 参数获取要在图形中绘制的轮廓级别数,它可以是整数或向量值。此参数仅在双变量数据的情况下才相关。此处,使用 cmap 参数更改绘图的颜色。cmap 参数可以取不同的值,在本示例中,将 PiYG 传递给它,产生的颜色范围从粉红色到绿色。cmap 可以取的其他一些值包括 blues、greens 等。
import seaborn as sns import matplotlib.pyplot as plt flights=sns.load_dataset("flights") flights.head() sns.kdeplot(data=flights, x="year", y="passengers",levels=10, cmap="PiYG") plt.show()
输出
使用上述参数获得的图如下所示。
这就是 kdeplot() 方法以及其参数的使用方法。