Seaborn - 核密度估计



核密度估计 (KDE) 是一种估计连续随机变量概率密度函数的方法。它用于非参数分析。

distplot 中将 hist 标志设置为 False 将生成核密度估计图。

示例

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'],hist=False)
plt.show()

输出

graph

拟合参数分布

distplot() 用于可视化数据集的参数分布。

示例

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'])
plt.show()

输出

histogram

绘制二元分布

二元分布用于确定两个变量之间的关系。这主要处理两个变量之间的关系以及一个变量相对于另一个变量的行为。

在 seaborn 中分析二元分布的最佳方法是使用 jointplot() 函数。

Jointplot 创建一个多面板图形,它投影了两个变量之间的二元关系,以及每个变量在单独轴上的单变量分布。

散点图

散点图是可视化分布的最便捷方法,其中每个观测值都通过 x 轴和 y 轴在二维图中表示。

示例

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df)
plt.show()

输出

bar and histogram

上图显示了鸢尾花数据中 petal_lengthpetal_width 之间的关系。图中的趋势表明研究变量之间存在正相关关系。

六边形图

当数据密度稀疏时,即当数据非常分散且难以通过散点图分析时,在二元数据分析中使用六边形分箱。

一个名为“kind”且值为“hex”的附加参数绘制六边形图。

示例

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()
HExagon and bar

核密度估计

核密度估计是一种非参数方法,用于估计变量的分布。在 seaborn 中,我们可以使用 jointplot() 绘制 kde。

将值“kde”传递给参数 kind 以绘制核密度图。

示例

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()

输出

xray
广告