402 次浏览
小提琴图类似于箱线图,但看起来像小提琴,并显示不同类别的数据的分布。它显示了数据值在不同点上的密度。在 R 中,我们可以借助 ggplot2 包绘制小提琴图,因为它有一个名为 geom_violin 的函数用于此目的。示例考虑以下数据框 - set.seed(1) x
698 次浏览
在任何绘图中,垂直线通常用于显示某些阈值,例如所考虑变量的范围。ggplot2 包提供 geom_vline 函数在绘图上创建垂直线,并且我们有此函数的 linetype 参数,可用于绘制点状垂直线。示例考虑以下数据框 - set.seed(9) x
925 次浏览
如果向量已排序,则 rank 函数给出向量中值的秩,但顺序与原始向量相同,而 order 函数给出向量中原始值的位置,但顺序为升序排序。rank 函数主要用于处理序数变量时的排名,因此,无论何时需要值的排名,我们都应该使用它,另一方面,order 经常用于对所有数值进行排序。示例 set.seed(100) x1
4K+ 次浏览
R 中有如此多的包,并且每个包都有不同的目标,因此,这些包中的函数数量足够多,可以解决分析中的问题。一个包可能包含 15 个函数,而另一个包可能包含 100 个函数,这完全取决于需要。我们可以使用 lsf.str 函数查找包内的函数,但在了解包内的函数之前,我们需要加载该包。示例 1 library(BSDA) lsf.str("package:BSDA") CIsim : function (samples = 100, n = 30, mu = 0, sigma = 1, conf.level = 0.95, type = "Mean") Combinations : function ... 阅读更多
469 次浏览
如果我们有一个长字符串,那么我们可能希望提取位于两个字符串之间的一部分字符串。例如,如果我们有一个字符串“电子学习正在改变世界教育体系”,并且我们想提取字符串“教育体系”勇敢,那么我们必须非常小心地传递字符串函数中的字符串,您可以在示例中了解这一点。使用 gsub 函数提取并不困难,但我们必须确保我们使用正确的语法,否则结果会变得令人讨厌。示例 x1
497 次浏览
有时数据被记录为一系列数值或字符串,我们可能需要查找每个序列的频率。这有助于我们检查运行的变化,但我们必须确保总频率等于总值数,否则我们的频率计算将不正确。要查找运行次数,我们可以在 R 中使用 rle 函数,它代表运行长度编码。示例 x1
7K+ 次浏览
gridExtra 包作为 par(mfrow) 与 ggplot2 的替代方案,因此,我们可以使用 ggplot2 和 gridExtra 在单个绘图窗口上创建多个绘图。现在,如果我们想给所有绘图都加上标题,或者我们可以说如果想给多图加上主标题,则将使用 top 参数使标题位于标题的顶部。类似地,我们可以根据我们的需要使用 bottom、left 和 right,但我们也需要 grid 包来实现此目的。示例考虑以下数据框 - set.seed(123) x1 阅读更多
399 次浏览
美国有 50 个州,其中一些州名称较短,但大多数州的名称很长。因此,如果我们正在处理包含美国州名称的数据,那么使用其名称访问州将有点复杂,因此建议使用缩写。我们可以借助 state.abb 函数获取州名称缩写。示例 state.abb[which(state.name=="New York")] [1] "NY" state.abb[which(state.name=="California")] [1] "CA" state.abb[which(state.name=="Texas")] [1] "TX" state.abb[which(state.name=="Florida")] [1] "FL" state.abb[which(state.name=="Washington")] [1] "WA" state.abb[which(state.name=="Michigan")] [1] "MI" state.abb[which(state.name=="New Jersey")] [1] "NJ" state.abb[which(state.name=="Arizona")] [1] "AZ" state.abb[which(state.name=="Pennsylvania")] [1] "PA" state.abb[which(state.name=="Alaska")] ... 阅读更多
128 次浏览
在 R 中创建向量有四个主要限制。在创建任何类型的向量时,我们必须记住这些限制 - 向量名称不能包含 % 符号。向量名称不能以数字开头。向量可以以点开头,但之后不能有数字。向量不能以下划线开头。示例包含 % 符号的向量 - x1%
689 次浏览
当我们为数据框计算相关矩阵时,所有列都必须是数值型的,如果不是这种情况,我们会收到错误 Error in cor(“data_frame_name”) : 'x' must be numeric。要解决此问题,我们可以逐个查找变量之间的相关性,或者使用 apply 函数。示例考虑以下数据框 - set.seed(99) x1