- Python 数据科学教程
- Python 数据科学 - 首页
- Python 数据科学 - 入门
- Python 数据科学 - 环境设置
- Python 数据科学 - Pandas
- Python 数据科学 - Numpy
- Python 数据科学 - SciPy
- Python 数据科学 - Matplotlib
- Python 数据处理
- Python 数据操作
- Python 数据清洗
- Python 处理 CSV 数据
- Python 处理 JSON 数据
- Python 处理 XLS 数据
- Python 关系型数据库
- Python NoSQL 数据库
- Python 日期和时间
- Python 数据整理
- Python 数据聚合
- Python 读取 HTML 页面
- Python 处理非结构化数据
- Python 词法分析
- Python 词干提取和词形还原
- Python 数据可视化
- Python 图表属性
- Python 图表样式
- Python 箱线图
- Python 热力图
- Python 散点图
- Python 气泡图
- Python 3D 图表
- Python 时间序列
- Python 地理数据
- Python 图数据
Python 箱线图
箱线图是衡量数据集内数据分布程度的一种方法。它将数据集分为三个四分位数。该图表表示数据集中的最小值、最大值、中位数、第一四分位数和第三四分位数。它也用于通过绘制每个数据集的箱线图来比较不同数据集的数据分布。
绘制箱线图
可以通过调用 Series.box.plot() 和 DataFrame.box.plot(),或者 DataFrame.boxplot() 来绘制箱线图,以可视化每一列中值的分布。
例如,这是一个表示对[0,1)上的均匀随机变量进行10次观测的五次试验的箱线图。
import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E']) df.plot.box(grid='True')
其**输出**如下:
广告