如何可视化R数据框中一列的正态分布?
分析变量的第一步是检查它是否是正态分布,而要以可视化方式做到这一点,我们需要创建一个直方图。如果直方图描绘出一条钟形曲线,那我们就认为该变量是正态分布,否则,它不是。我们可以通过使用 hist 函数为 R 数据框的任意一列创建一个直方图。
示例
考虑以下数据框 -
set.seed(9) df<-data.frame(x1=rbinom(100,50,0.7),x2=rbinom(1000,50,0.7),x3=rbinom(5000,50,0.7))
为 x1、x2 和 x3 创建直方图 -
hist(df$x1)
输出
hist(df$x2)
输出
hist(df$x3)
输出
广告