124 次浏览
分析变量的第一步是检查它是否服从正态分布,并且为了直观地做到这一点,我们创建了一个直方图。如果直方图显示为钟形,则我们认为该变量服从正态分布,否则,它不服从正态分布。我们可以使用 hist 函数为 R 数据框的任何列创建直方图。示例考虑以下数据框 - set.seed(9) df
411 次浏览
有多种方法可以表示图表,特别是条形图以多种变体表示。我们还可以在条形图中包含条形标签,以便查看者可以轻松理解条形对应类别的频率。为了在条形图的顶部放置标签,我们可以在 ggplot2 中使用 geom_text 中的 vjust = 0。示例实时演示考虑以下数据框 - df
757 次浏览
查找行均值可以帮助我们识别案例的平均性能(如果所有变量的性质相同),并且这也很容易做到。但是,如果某些列具有不同类型的数据,则我们必须提取想要查找行均值的列。因此,我们可以使用 rowMeans 函数创建一个包含所需列的行均值的新数据框。示例实时演示考虑以下数据框 - set.seed(88) Group
112 次浏览
加法、减法、乘法和除法等基本数学运算对于矩阵来说很常见,我们经常这样做,但是如果矩阵存储为 R 中的列表,则这些基本计算以不同的方式完成,因为它们不是直接对象。要将列表中的矩阵相加或相乘,我们可以使用 Reduce 函数以及加号 (+) 或乘号 (*) 和列表名称。示例实时演示考虑以下矩阵列表 - Matrices_List
540 次浏览
在 R 中进行子集操作并不难,但是如果我们使代码简短,则这是一项有点繁琐的任务,因为我们必须在代码之间引入代码,这会导致混淆。因此,在编写一个代码内部的代码时,我们必须非常小心。要使用 ggplot2 的 ggplot 函数创建带有子集数据框的折线图,可以通过使用 subset 函数来实现。示例实时演示考虑以下数据框 - set.seed(99) x1
376 次浏览
韦恩图有助于识别两个或多个元素集合之间共同和不共同的元素。它也用于概率论中,以直观地表示两个或多个事件之间的关系。要在 R 中创建韦恩图,我们可以使用 gplots 包的 venn 函数。示例考虑以下向量 x
372 次浏览
销售分析需要查找月度销售额的平均值、总计、范围,并且通常还需要标准差。快速消费品 (FMCG) 公司通常需要这样做,因为他们希望每天以及每月跟踪他们的销售情况。如果我们有每日销售数据,则需要在 R 数据框中为月份创建一个新列以查找月度销售额,这可以通过 strftime 和 aggregate 函数来完成。示例考虑以下数据框 - date
4K+ 次浏览
有多种方法可以保存 R 中创建的图形。基础 R 提供了 metafile、bitmap 和 postscript 选项来复制和保存 R 中创建的图形,但我们也可以使用 svglite 包将使用 ggplot2 创建的图形保存为 SVG 文件。svglite 包的 ggsave 函数可以轻松完成此工作,我们还可以在此函数内部定义图形的高度和宽度。示例实时演示安装 svglite 包 - install.packages("svglite")考虑 ToothGrowth 数据并在 len 和 dose 之间创建散点图 - head(ToothGrowth) len supp dose 1 4.2 VC ... 阅读更多
2K+ 次浏览
出现“newdata”有 1 行警告的原因是 newdata 未正确定义。我们应该将解释变量或自变量的名称赋予 newdata,以便模型能够识别我们正在传递解释变量的均值,否则它会考虑解释变量的所有值,因此 predict 函数的结果会产生样本大小的预测值。示例实时演示考虑以下数据框 - set.seed(123) x
590 次浏览
创建条形图时,条形之间的距离或间距相等,但有时条形的宽度很大,因此,理解这些条形之间的差异变得有点困难,尤其是在数据值彼此之间差异不大的情况下。为了克服这个可视化问题,我们可以创建一个条形之间有一些间距的条形图,这可以通过 ggplot2 中 geom_bar 的 width 参数来实现。示例考虑以下数据框 - x