Seaborn.kdeplot() 方法



Seaborn.kdeplot() 方法有助于使用核密度估计绘制单变量或双变量分布。

与直方图类似,核密度估计图是一种显示数据集观测值分布的技术。核密度估计 (KDE) 使用一维或多维的连续概率密度曲线来描述数据。

语法

以下是 Seaborn.kdeplot() 方法的语法

Seaborn.kdeplot(x=None, *, y=None, shade=None, vertical=False, kernel=None, bw=None, gridsize=200, cut=3, clip=None, legend=True, cumulative=False, shade_lowest=None, cbar=False, cbar_ax=None, cbar_kws=None, ax=None, weights=None, hue=None, palette=None, hue_order=None, hue_norm=None, multiple='layer', common_norm=True, common_grid=False, levels=10, thresh=0.05, bw_method='scott', bw_adjust=1, log_scale=None, color=None, fill=None, data=None, data2=None, warn_singular=True, **kwargs)

参数

下面讨论了 seaborn.kdeplot() 方法的一些参数。

序号 参数及描述
1 x,y

在 x、y 轴上表示的变量。

2 Hue

这将生成具有不同颜色的元素。它是一个分组变量。

3 Levels

此参数用于指定在图中绘制轮廓的级别数。

4 Cmap

Cmap 或颜色映射用于指定用于绘制地图的颜色。采用不同类型的值,例如 blues、greens、PiYg 等。

5 Bw_adjust

采用数值,并随着传递的值增加而使绘制的曲线变得平滑。

6 Thresh

用于指定绘制轮廓的最低级别。取值为 0 到 1。

7 Cumulative

绘制累积计数,随着箱数的增加。

8 Multiple

与单变量数据相关,并取值:stacked、layer 和 fill。

9 Log_scale

将轴刻度设置为对数,并以对数刻度绘制所绘制的值。

10 Legend

布尔值。如果为假,则不打印语义变量的图例。

让我们在继续绘制图形之前加载 Seaborn 库和数据集。

加载 Seaborn 库

要加载或导入 Seaborn 库,可以使用以下代码行。

Import seaborn as sns

需要哪种数据?

需要双变量数据才能理解 kdeplot() 方法中包含的大多数参数。尽管此方法提供了绘制单变量数据 kdeplot() 的方法,但它具有更多参数来绘制双变量数据,因此考虑使用 flights 数据集,因为它包含双变量数据。

(双变量数据意味着数据依赖于多个变量,而单变量数据意味着数据仅依赖于一个变量。)

加载数据集

在本文中,我们将使用 seaborn 库中内置的 flights 数据集。以下命令用于加载数据集。

flights=sns.load_dataset("flights")

以下命令用于查看数据集中前 5 行。这使我们能够了解可以使用哪些变量来绘制图形。

flights.head()

以下是上述代码段的输出。

index,year,month,passengers
0,1949,Jan,112
1,1949,Feb,118
2,1949,Mar,132
3,1949,Apr,129
4,1949,May,121

现在我们已经加载了数据,我们将继续绘制数据。

示例 1

在此示例中,我们将了解如何使用 seaborn.kdeplot() 方法为宽格式数据集中的每一列绘制核密度估计。为此,可以使用以下代码行。

import seaborn as sns
import matplotlib.pyplot as plt
flights=sns.load_dataset("flights")
flights.head()
sns.kdeplot(data=flights)
plt.show()

输出

上述代码的输出图形如下所示。

seaborn kdeplot method

示例 2

现在,我们将了解如何为给定数据集绘制基本 kdeplot。

import seaborn as sns
import matplotlib.pyplot as plt
flights=sns.load_dataset("flights")
flights.head()
sns.kdeplot(data=flights, x="year", y="passengers")
plt.show()

输出

上述代码片段的输出图如下所示。

basic kdeplot

示例 3

在此示例中,我们将了解如何使用 fill 参数。因此,此参数用于填充定义的图形轮廓中的颜色。在下面的代码中,考虑了 x、y 和 hue 参数,并且由于将 True 传递给 fil 参数,因此获得的图形填充了颜色。

import seaborn as sns
import matplotlib.pyplot as plt
flights=sns.load_dataset("flights")
flights.head()
sns.kdeplot(data=flights, x="year", y="passengers",fill=True,hue="month")
plt.show()

输出

上述代码片段的输出如下所示:

fill color

如上所述,此处填充了图形的轮廓。

示例 4

我们将在本示例中了解 levels 参数。Levels 参数获取要在图形中绘制的轮廓级别数,它可以是整数或向量值。此参数仅在双变量数据的情况下才相关。此处,使用 cmap 参数更改绘图的颜色。cmap 参数可以取不同的值,在本示例中,将 PiYG 传递给它,产生的颜色范围从粉红色到绿色。cmap 可以取的其他一些值包括 blues、greens 等。

import seaborn as sns
import matplotlib.pyplot as plt
flights=sns.load_dataset("flights")
flights.head()
sns.kdeplot(data=flights, x="year", y="passengers",levels=10, cmap="PiYG")
plt.show()

输出

使用上述参数获得的图如下所示。

change color of plot

这就是 kdeplot() 方法以及其参数的使用方法。

seaborn_distribution_plot_introduction.htm
广告