演示Python中小提琴图的工作原理?
如果我们希望比较类别中存在的数据,则可以使用箱线图。这是一种利用分位数来了解数据集中数据分布的方式。它由从箱体延伸出的垂直线组成。这些延伸部分称为须线。这些须线说明了数据在上下四分位数之外的变化情况。这就是为什么箱线图也称为须线图的原因。数据中的异常值将作为单个点绘制。
小提琴图是箱线图与核密度估计 (KDE) 的组合。它更容易分析和理解数据的分布方式。小提琴图的宽部分表示数据密度较高。小提琴图的窄部分表示数据密度较低。
箱线图中的四分位数间距和数据的高密度部分在每个类别中都落在同一区域。
violinplot 函数的语法
seaborn.violinplot(x, y,data,…)
让我们了解如何使用小提琴图绘制数据:
示例
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt my_df = sb.load_dataset('tips') sb.violinplot(x = "day", y = "total_bill", data=my_df) plt.show()
输出
解释
- 导入了所需的包。
- 输入数据为“iris_data”,它从 scikit learn 库加载。
- 此数据存储在数据框中。
- 使用“load_dataset”函数加载 iris 数据。
- 使用“violinplot”函数可视化此数据。
- 在此,数据框作为参数提供。
- 此外,还指定了 x 和 y 值。
- 此数据显示在控制台中。
广告