如何在 Python Seaborn 中使用箱线图比较不同类别的数据?


Seaborn 库有助于数据可视化。它带有自定义主题和高级接口。

散点图提供的信息有限,因为它们只告诉我们给定数据类别中值的分布情况。如果我们希望比较类别内存在的数据,我们需要使用不同的技术。这就是箱线图发挥作用的地方。它是一种利用分位数来理解数据集中数据分布的方法。

它由从箱体延伸出的垂直线组成。这些延伸部分称为须线。这些须线描述了数据在上四分位数和下四分位数之外的变化情况。这就是为什么箱线图也称为须线图的原因。

箱线图函数的语法

seaborn.boxplot(x, y,data,…)

数据中的异常值将作为单个点绘制。以下是一个示例:

示例

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
my_df = sb.load_dataset('iris')
sb.boxplot(x = "species", y = "petal_length", data = my_df)
plt.show()

输出

解释

  • 导入所需的包。
  • 输入数据是“iris_data”,它从 scikit-learn 库加载。
  • 此数据存储在数据框中。
  • 使用“load_dataset”函数加载 iris 数据。
  • 使用“boxplot”函数可视化此数据。
  • 在这里,数据框作为参数提供。
  • 此外,还指定了 x 和 y 值。
  • 此数据显示在控制台中。

更新于:2020年12月11日

275 次浏览

启动你的职业生涯

完成课程获得认证

开始
广告