1K+ 浏览量
如果 R 数据框中的一列包含以下划线分隔的字符串值,并且这些值的大小也包含公共值,那么最好一次性删除所有值中的下划线以及公共值。这将有助于我们正确读取数据,并且分析也将变得更容易。为此,我们可以使用 gsub 函数考虑以下数据框 - 示例 在线演示set.seed(191) ID
2K+ 浏览量
如果我们在 R 数据框中有一个分组列,并且我们认为其中一个分组值对我们的分析没有用,那么我们可能希望删除包含该值的所有行,并继续进行分析,也可能其中一个值重复出现,我们希望去除它。在这种情况下,我们可以使用否定和单个方括号对数据框进行子集化。示例 在线演示set.seed(1212) x
400 浏览量
我们知道列表可以包含多种类型以及不同大小的多个元素。例如,一个包含两个元素的列表,一个元素可能包含 15 个元素,而另一个可能包含 25 个元素。在这种情况下,我们可能希望用 10 个更多元素填充第一个元素,以便两个元素的大小相等。这可以通过使用 lapply 函数完成,如下面的示例所示。考虑以下列表 - 示例 在线演示set.seed(101) x1
6K+ 浏览量
伯努利随机变量中的每个值代表单个试验的成功或失败,这使其与二项式随机变量不同,因为二项式随机变量表示多次试验的成功或失败次数。要生成伯努利随机变量,我们可以使用 rbinom 函数,但我们需要为 size 参数传递 1。示例 在线演示rbinom(120, 1, 0.71)输出[1] 1 1 1 1 1 1 0 0 0 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1 1 1 1 1 0 ... 阅读更多
750 浏览量
R 中的数据框可以有无限数量的唯一值,并且它还可以包含许多重复的值。因此,查找数据框中所有唯一值的个数可以帮助我们了解数据的多样性,但这在预期存在重复元素的情况下最常这样做,否则就没有意义。要计算所有唯一值的出现次数,我们可以使用 table 函数以及 unlist,如下面的示例所示。考虑以下数据框 - 示例 在线演示x1
一般来说,我们可以说方差齐性检验是一种比较两个或多个变量的方差并找到它们之间是否存在显著差异的检验。对于双因素方差分析,最常用的方差齐性检验之一是 Levene 检验,它可以通过使用 base R 中 car 包的 leveneTest 函数轻松完成。考虑以下数据框 - 示例 在线演示set.seed(151) x1F) group 6 0.6593 0.6835 13
8K+ 浏览量
在数据分析中,有时我们需要统计大于或小于某个值的数值个数,而这个某个值可能是一个阈值。例如,我们可能有一个包含人员血压值的向量,并且我们可能希望检查有多少个值大于 120。在这种情况下,我们可以使用 length 函数,如下面的示例所示。示例 在线演示x11])输出[1] 9 示例 在线演示x25])输出[1] 93示例 在线演示x35])输出[1] 42示例 在线演示x40])输出[1] 108示例 在线演示x51])输出[1] 107示例 在线演示x65])输出[1] 31示例 在线演示x71])输出[1] 21示例 在线演示x84])输出[1] 19示例 在线演示x9118])输出[1] 11示例 在线演示x105000])输出[1] 68阅读更多
矩阵可以通过在 R 中使用 matrix 函数创建,如果我们想通过复制向量来创建矩阵,那么我们只需要关注复制。例如,如果我们有一个向量 V,并且我们想通过复制 V 两次来创建矩阵,那么矩阵可以创建为 matrix(replicate(2,V),nrow=2)。示例 1 在线演示V1
条形图是用 geom_bar 函数创建的,但在条形和 X 轴标签之间始终存在一些空间。如果我们想减少该空间或完全删除它,我们需要使用 scale_y_continuous 函数为前者定义 expand 参数,为后者定义 scale_y_continuous(expand=c(0,0))。示例 在线演示考虑以下数据框 - set.seed(888) x
5K+ 浏览量
当我们将矩阵与向量相乘时,输出是一个向量。假设我们有一个矩阵 M 和一个向量 V,那么它们可以乘以 M%*%V。要理解分步乘法,我们可以将向量中的每个值与矩阵中的行值相乘,并找出该乘法的总和。示例 1 在线演示M1