- Seaborn 教程
- Seaborn - 首页
- Seaborn - 简介
- Seaborn - 环境设置
- 导入数据集和库
- Seaborn - 图表美化
- Seaborn - 调色板
- Seaborn - 直方图
- Seaborn - 核密度估计
- 可视化成对关系
- Seaborn - 绘制分类数据
- 观测值的分布
- Seaborn - 统计估计
- Seaborn - 绘制宽格式数据
- 多面板分类图
- Seaborn - 线性关系
- Seaborn - 分面网格
- Seaborn - 对网格
- 函数参考
- Seaborn - 函数参考
- Seaborn 有用资源
- Seaborn - 快速指南
- Seaborn - 有用资源
- Seaborn - 讨论
Seaborn - 统计估计
在大多数情况下,我们处理的是整个数据分布的估计。但是当涉及到中心趋势估计时,我们需要一种特定的方法来总结分布。均值和中位数是经常用来估计分布中心趋势的技术。
在我们上面部分学习的所有图表中,我们都对整个分布进行了可视化。现在,让我们讨论一下我们可以用哪些图表来估计分布的中心趋势。
条形图
barplot()显示了分类变量和连续变量之间的关系。数据以矩形条表示,其中条的长度表示该类别中数据的比例。
条形图表示中心趋势的估计。让我们使用“泰坦尼克号”数据集来学习条形图。
示例
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('titanic') sb.barplot(x = "sex", y = "survived", hue = "class", data = df) plt.show()
输出
在上面的例子中,我们可以看到每个等级中男性和女性的平均生存人数。从图中我们可以看出,女性的生存人数多于男性。在男性和女性中,头等舱的生存人数较多。
barplot的一个特例是显示每个类别中的观测值数量,而不是计算第二个变量的统计量。为此,我们使用countplot()。
示例
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('titanic') sb.countplot(x = " class ", data = df, palette = "Blues"); plt.show()
输出
图表显示,三等舱的乘客数量高于一等舱和二等舱。
点图
点图与条形图的作用相同,但样式不同。它不是使用完整的条形,而是用某个高度的点在另一条轴上表示估计值。
示例
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('titanic') sb.pointplot(x = "sex", y = "survived", hue = "class", data = df) plt.show()
输出
广告