如何在 Python Seaborn 中使用箱线图比较不同类别的数据?
Seaborn 库有助于数据可视化。它带有自定义主题和高级接口。
散点图提供的信息有限,因为它们只告诉我们给定数据类别中值的分布情况。如果我们希望比较类别内存在的数据,我们需要使用不同的技术。这就是箱线图发挥作用的地方。它是一种利用分位数来理解数据集中数据分布的方法。
它由从箱体延伸出的垂直线组成。这些延伸部分称为须线。这些须线描述了数据在上四分位数和下四分位数之外的变化情况。这就是为什么箱线图也称为须线图的原因。
箱线图函数的语法
seaborn.boxplot(x, y,data,…)
数据中的异常值将作为单个点绘制。以下是一个示例:
示例
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt my_df = sb.load_dataset('iris') sb.boxplot(x = "species", y = "petal_length", data = my_df) plt.show()
输出
解释
- 导入所需的包。
- 输入数据是“iris_data”,它从 scikit-learn 库加载。
- 此数据存储在数据框中。
- 使用“load_dataset”函数加载 iris 数据。
- 使用“boxplot”函数可视化此数据。
- 在这里,数据框作为参数提供。
- 此外,还指定了 x 和 y 值。
- 此数据显示在控制台中。
广告