Matplotlib - 带状盒图
在带状盒图中 -
每个类别或组通常在 x 轴上表示。
y 轴通常表示数值变量的范围或分布。
在这里,我们创建了一个简单的带状盒图,其中 x 轴上有三个类别(类别 1、类别 2、类别 3),以及它们在 y 轴上相应的数值分布。我们对带状盒进行阴影以指示每个类别内分布的强度。
Matplotlib 中的带状盒图
在 Matplotlib 中,“带状盒图”是一种视觉表示,用于显示跨不同类别或组的数值变量的分布。虽然 matplotlib 没有创建带状盒图的特定函数,但您可以使用其他可用的技术,例如 -
使用 matplotlib 的 plot() 函数为每个类别或组绘制中心线。这条线表示每个类别内数据的集中趋势,例如平均值或中位数。
使用 fill_between 函数填充两条曲线之间的区域,其中一条曲线表示带状的上边界,另一条曲线表示下边界。
在 matplotlib 中,带有置信区间的简单带状盒图是一种图形表示,用于显示数据集的集中趋势以及围绕该中心值的误差范围。
在以下示例中,我们正在创建一个带状盒图,使用 matplotlib 的 plot() 和 fill_between() 函数分别显示正弦波的集中趋势和置信区间(误差范围) -
import matplotlib.pyplot as plt import numpy as np # Generating data x = np.linspace(0, 10, 100) y_mean = np.sin(x) # Standard deviation y_std = 0.1 # Plotting the central line plt.plot(x, y_mean, color='blue', label='Mean') # Plotting the shaded area representing the uncertainty (confidence interval) plt.fill_between(x, y_mean - y_std, y_mean + y_std, color='blue', alpha=0.2, label='Uncertainty') plt.xlabel('X') plt.ylabel('Y') plt.title('Simple Ribbon Box Plot with Confidence Interval') plt.legend() plt.grid(True) plt.show()
以下是上述代码的输出 -
在 Matplotlib 中,多个带状盒图是一种使用同一图中的带状盒图比较多个数据集分布的方法。每个带状盒图表示不同数据集的离散程度和集中趋势,便于在它们之间进行比较。
在这里,我们使用 matplotlib 生成多个带状盒图,使用不同的颜色来表示两个正弦波和余弦波及其误差带 -
import matplotlib.pyplot as plt import numpy as np # Generating data x = np.linspace(0, 10, 100) y_means = [np.sin(x), np.cos(x)] # Standard deviations y_stds = [0.1, 0.15] colors = ['blue', 'green'] # Plotting multiple ribbon box plots with different colors for y_mean, y_std, color in zip(y_means, y_stds, colors): plt.plot(x, y_mean, color=color, label='Mean', alpha=0.7) plt.fill_between(x, y_mean - y_std, y_mean + y_std, color=color, alpha=0.2) plt.xlabel('X') plt.ylabel('Y') plt.title('Multiple Ribbon Box Plots with Different Colors') plt.legend() plt.grid(True) plt.show()
执行上述代码后,我们将获得以下输出 -
在 Matplotlib 中,堆叠带状盒图是一种图形表示,用于比较多个数据集的分布,同时显示所有数据集的组合分布。
现在,我们正在绘制一个堆叠带状盒图,将正弦波和余弦波的分布堆叠起来,以使用 matplotlib 比较它们在 x 轴上的变化 -
import matplotlib.pyplot as plt import numpy as np # Generating example data x = np.linspace(0, 10, 100) y1 = np.sin(x) y2 = np.cos(x) # Plotting stacked ribbon box plot plt.plot(x, y1, color='blue', label='Dataset 1') plt.fill_between(x, y1, color='blue', alpha=0.2) plt.plot(x, y2, color='green', label='Dataset 2') plt.fill_between(x, y2, color='green', alpha=0.2) plt.xlabel('X') plt.ylabel('Y') plt.title('Stacked Ribbon Box Plot') plt.legend() plt.grid(True) plt.show()
执行上述代码后,我们将获得以下输出 -
Matplotlib 中的水平带状盒图是一种图形表示,它使用带状盒在水平轴上显示数据集的分布。
在以下示例中,我们正在创建一个水平带状盒图,以使用 matplotlib 表示 y 轴上的类别及其相应的平均值和误差范围 -
import matplotlib.pyplot as plt import numpy as np # Generating data y = np.arange(1, 6) x_means = [5, 7, 6, 8, 9] x_stds = [0.5, 0.3, 0.4, 0.2, 0.6] # Plotting horizontal ribbon box plot plt.plot(x_means, y, color='blue', label='Mean', linestyle='none', marker='o') plt.fill_betweenx(y, np.subtract(x_means, x_stds), np.add(x_means, x_stds), color='blue', alpha=0.2) # Fixing this line plt.xlabel('X') plt.ylabel('Y') plt.title('Horizontal Ribbon Box Plot') plt.legend() plt.grid(True) plt.show()
执行上述代码后,我们将获得以下输出 -