在 Python 的 Seaborn 库中使用 stripplot 创建分类散点图时,如何避免数据点重叠?


数据可视化是一个重要步骤,因为它有助于理解数据中的情况,而无需查看数字并执行复杂的计算。Seaborn 是一个有助于数据可视化的库。它带有自定义主题和高级界面。

当需要处理的变量本质上是分类变量时,不能使用一般的散点图、直方图等。这时需要使用分类散点图。

诸如“stripplot”、“swarmplot”之类的绘图用于处理分类变量。“stripplot”函数用于至少一个变量是分类变量的情况。数据沿一个轴以排序的方式表示。但缺点是某些点会重叠。这就是需要使用“jitter”参数来避免变量之间重叠的地方。

它向数据集添加一些随机噪声,并调整分类轴上值的位。

stripplot 函数的语法

seaborn.stripplot(x, y,data, jitter = …)

让我们看看如何使用“jitter”参数在数据集中绘制分类变量:

示例

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
my_df = sb.load_dataset('iris')
sb.stripplot(x = "species", y = "petal_length", data = my_df, jitter = True)
plt.show()

输出

解释

  • 导入所需的包。
  • 输入数据是“iris_data”,它从 scikit-learn 库加载。
  • 此数据存储在数据框中。
  • “load_dataset”函数用于加载 iris 数据。
  • 使用“stripplot”函数可视化此数据。
  • 传递一个名为“jitter”的附加参数以避免数据框值的重叠。
  • 此处,数据框作为参数提供。
  • 此外,还指定了 x 和 y 值。
  • 此数据显示在控制台中。

更新于:2020年12月11日

1K+ 次查看

启动您的 职业生涯

完成课程后获得认证

开始学习
广告