Python 箱线图



箱线图是衡量数据集内数据分布程度的一种方法。它将数据集分为三个四分位数。该图表表示数据集中的最小值、最大值、中位数、第一四分位数和第三四分位数。它也用于通过绘制每个数据集的箱线图来比较不同数据集的数据分布。

绘制箱线图

可以通过调用 Series.box.plot() 和 DataFrame.box.plot(),或者 DataFrame.boxplot() 来绘制箱线图,以可视化每一列中值的分布。

例如,这是一个表示对[0,1)上的均匀随机变量进行10次观测的五次试验的箱线图。

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box(grid='True')
 

其**输出**如下:

boxplot.png
广告