1K+ 阅读量
如果 R 数据框中的一列包含以下划线分隔的字符串值,并且扩展了也包含公共值的列值的尺寸,那么最好一次性从所有值中删除下划线符号以及公共值。这将有助于我们正确读取数据,并且分析也将变得更容易。为此,我们可以使用 gsub 函数。请考虑以下数据框 - 示例 实时演示 set.seed(191) ID
2K+ 阅读量
如果我们在 R 数据框中有一个分组列,并且我们认为其中一个组值对我们的分析没有用,那么我们可能希望删除包含该值的所有行并继续进行分析,也可能其中一个值重复出现,我们希望摆脱它。在这种情况下,我们可以使用否定和单个方括号对数据框进行子集化。示例 实时演示 set.seed(1212) x
400 阅读量
我们知道列表可以包含不同类型以及不同大小的多个元素。例如,一个包含两个元素的列表,其中一个元素可能包含 15 个元素,而另一个可能包含 25 个元素。在这种情况下,我们可能希望用 10 个更多元素填充第一个元素,以便两个元素的大小相等。这可以通过使用 lapply 函数完成,如下面的示例所示。请考虑以下列表 - 示例 实时演示 set.seed(101) x1
6K+ 阅读量
伯努利随机变量中的每个值都表示单个试验的成功或失败,这使其与二项式随机变量不同,因为二项式随机变量表示多次试验的成功或失败次数。要生成伯努利随机变量,我们可以使用 rbinom 函数,但我们需要为 size 参数传递 1。示例 实时演示 rbinom(120, 1, 0.71) 输出 [1] 1 1 1 1 1 1 0 0 0 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1 1 1 1 1 0 ... 阅读更多
750 阅读量
R 中的数据框可以具有无限数量的唯一值,并且还可以包含许多重复值。因此,查找数据框中所有唯一值的个数可以帮助我们了解数据的多样性,但这在预期存在重复元素的情况下最常进行,否则将没有意义。要计算所有唯一值的出现次数,我们可以使用 table 函数以及 unlist,如下面的示例所示。请考虑以下数据框 - 示例 实时演示 x1
一般来说,我们可以说方差齐性检验是一种比较两个或多个变量的方差并找出它们之间是否存在显著差异的检验。对于双因素方差分析,最常用的方差齐性检验之一是 Levene 检验,它可以通过使用 base R 中 car 包的 leveneTest 函数轻松完成。请考虑以下数据框 - 示例 实时演示 set.seed(151) x1F) group 6 0.6593 0.6835 13
8K+ 阅读量
在数据分析中,有时我们需要计算大于或小于某个值的数值个数,而这个值可能是一个阈值。例如,我们可能有一个包含人员血压值的向量,我们可能希望检查有多少值大于 120。在这种情况下,我们可以使用 length 函数,如下面的示例所示。示例 实时演示 x11]) 输出 [1] 9 示例 实时演示 x25]) 输出 [1] 93 示例 实时演示 x35]) 输出 [1] 42 示例 实时演示 x40]) 输出 [1] 108 示例 实时演示 x51]) 输出 [1] 107 示例 实时演示 x65]) 输出 [1] 31 示例 实时演示 x71]) 输出 [1] 21 示例 实时演示 x84]) 输出 [1] 19 示例 实时演示 x9118]) 输出 [1] 11 示例 实时演示 x105000]) 输出 [1] 68 阅读更多
可以使用 R 中的 matrix 函数创建矩阵,如果我们想通过复制向量来创建矩阵,那么我们只需要关注复制即可。例如,如果我们有一个向量 V,并且我们想通过复制 V 两次来创建矩阵,那么该矩阵可以创建为 matrix(replicate(2,V),nrow=2)。示例 1 实时演示 V1
条形图是用 geom_bar 函数创建的,但条形和 X 轴标签之间总是存在一些空间。如果我们想减少该空间或完全删除它,我们需要使用 scale_y_continuous 函数为前者定义 expand 参数,为后者定义 scale_y_continuous(expand=c(0,0))。示例 实时演示 请考虑以下数据框 - set.seed(888) x
5K+ 阅读量
当我们将矩阵与向量相乘时,输出是一个向量。假设我们有一个矩阵 M 和向量 V,那么它们可以乘以 M%*%V。要了解逐步乘法,我们可以将向量中的每个值与矩阵中的行值相乘,并找出该乘法的总和。示例 1 实时演示 M1