在 Python 的 Seaborn 库中使用 stripplot 创建分类散点图时,如何避免数据点重叠?
数据可视化是一个重要步骤,因为它有助于理解数据中的情况,而无需查看数字并执行复杂的计算。Seaborn 是一个有助于数据可视化的库。它带有自定义主题和高级界面。
当需要处理的变量本质上是分类变量时,不能使用一般的散点图、直方图等。这时需要使用分类散点图。
诸如“stripplot”、“swarmplot”之类的绘图用于处理分类变量。“stripplot”函数用于至少一个变量是分类变量的情况。数据沿一个轴以排序的方式表示。但缺点是某些点会重叠。这就是需要使用“jitter”参数来避免变量之间重叠的地方。
它向数据集添加一些随机噪声,并调整分类轴上值的位。
stripplot 函数的语法
seaborn.stripplot(x, y,data, jitter = …)
让我们看看如何使用“jitter”参数在数据集中绘制分类变量:
示例
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt my_df = sb.load_dataset('iris') sb.stripplot(x = "species", y = "petal_length", data = my_df, jitter = True) plt.show()
输出
解释
- 导入所需的包。
- 输入数据是“iris_data”,它从 scikit-learn 库加载。
- 此数据存储在数据框中。
- “load_dataset”函数用于加载 iris 数据。
- 使用“stripplot”函数可视化此数据。
- 传递一个名为“jitter”的附加参数以避免数据框值的重叠。
- 此处,数据框作为参数提供。
- 此外,还指定了 x 和 y 值。
- 此数据显示在控制台中。
广告