如何在 R 中可视化包含缺失值的 DataFrame?
如果一个 DataFrame 包含缺失值,那么在基础 R 中可视化它并不容易,但我们可以为此目的使用 visdat 包。visdat 包的 vis_dat 函数有助于可视化任何 DataFrame,即使它包含缺失值。例如,如果一个 DataFrame df 包含缺失值,则可以将其可视化为 vis_dat(df)。
示例 1
考虑以下 DataFrame:
> x1<-sample(c(NA,1:2),20,replace=TRUE) > x2<-sample(c(NA,21:24),20,replace=TRUE) > x3<-sample(c(NA,5,10),20,replace=TRUE) > df1<-data.frame(x1,x2,x3) > df1
输出
x1 x2 x3 1 1 23 10 2 1 23 NA 3 NA NA 10 4 NA NA 10 5 1 24 NA 6 2 22 NA 7 2 24 NA 8 2 24 NA 9 2 21 NA 10 1 23 10 11 NA 24 NA 12 2 22 NA 13 2 NA 10 14 NA 24 10 15 2 NA 5 16 2 21 NA 17 2 23 NA 18 2 NA 5 19 NA 21 10 20 2 NA 5
加载 visdat 包并创建 DataFrame 的图表:
Explore our latest online courses and learn new skills at your own pace. Enroll and become a certified expert to boost your career.
示例
> library(visdat) > vis_dat(df1)
输出
示例 2
> y1<-sample(c(NA,rpois(5,2)),20,replace=TRUE) > y2<-rnorm(20) > y3<-sample(c(NA,rnorm(5,2,2.1)),20,replace=TRUE) > y4<-sample(c(NA,runif(5,2,3)),20,replace=TRUE) > df2<-data.frame(y1,y2,y3,y4) > df2
输出
y1 y2 y3 y4 1 4 0.61081616 NA NA 2 3 0.97203884 NA 2.039603 3 1 -0.19848158 2.798295 2.996374 4 NA -0.06643532 1.327976 NA 5 1 -0.08782965 1.327976 2.996374 6 1 -1.74682203 NA 2.996374 7 NA -1.07706177 3.255620 2.039603 8 1 -0.47827253 1.327976 2.670070 9 1 -1.52099043 1.524140 2.773155 10 3 0.80431131 2.798295 2.773155 11 4 -0.92503650 NA 2.996374 12 1 0.09717851 1.524140 2.429227 13 NA 0.59296946 NA 2.039603 14 4 0.40156867 1.524140 2.996374 15 1 -0.25442642 NA 2.773155 16 1 -1.65687286 2.798295 2.996374 17 1 0.35774521 1.524140 2.773155 18 NA 0.09490436 1.524140 2.773155 19 4 -0.63289635 NA 2.773155 20 1 -0.48500639 1.524140 NA
示例
> vis_dat(df2)
输出
广告