429 次浏览
有时,我们的数据集中会包含不需要的信息,这些信息可能是一个单一案例、多个案例、整个变量或任何其他无助于实现分析目标的内容,因此我们需要将其删除。如果我们想借助 dplyr 包从 R 数据框中删除此类行,可以使用 anti_join 函数。示例考虑以下数据框:在线演示> set.seed(2514) > x1 x2 df1 df1输出 x1 x2 1 5.567262 4.998607 2 5.343063 4.931962 3 2.211267 ... 阅读更多
146 次浏览
要生成密码,我们可以使用 stringi 包的 stri_rand_strings 函数。如果我们想要生成不同长度的密码,则需要分别使用特定大小来创建密码。例如,对于长度为 8 的密码,我们可以在 stri_rand_strings 函数中使用 length 参数。加载 stringi 包:> library(stringi)示例1> stri_rand_strings(n=5, length=8, pattern="[0-9a-zA-Z]") [1] "YkIEDYQz" "t42JCzYO" "rOE9YN8U" "2lu9AonY" "6lDUxScX"示例2> stri_rand_strings(n=20, length=8, pattern="[0-9a-zA-Z]") [1] "glH3ysoX" "X0Sgvg3F" "P3YOePTa" "45GOb2hA" "tLCwszus" "CerCi1ks" [7] "UtFwzrSc" "pG8AJCQX" "NTCdMRHj" "5thI1wKb" "Ic8Rol1Y" "JakWa1Wd" [13] "9AfeXo7T" "SFJVn9XV" "lIRhLbJ9" "DNFyAbkJ" "jV4jJRZk" "IthkzfEU" [19] "talj9nBq" "Nak9Tidh"示例3> ... 阅读更多
1K+ 次浏览
在使用 ggplot 包创建的绘图中,所有绘图的周围都存在一个额外的区域,该区域使用了额外的空间,因此我们可能希望通过删除该额外边距区域来消除该空间。这可以通过使用 scale_x_continuous 和 scale_y_continuous 函数将两个轴的刻度设置为零来完成。考虑以下数据框 - 示例 在线演示 set.seed(151) x
7K+ 次浏览
列表的交集是指列表之间唯一且共同的元素。例如,如果我们有一个包含 1、2、3、3、3、2、1 的列表,另一个列表包含 2、2、1、2、1,则交集将只返回列表之间共同且唯一的元素,因此对于此示例,我们将得到 1 和 2。在 R 中,我们可以使用 intersection 函数和 Reduce 函数来实现这一点。考虑以下列表 - 示例 在线演示 列表1
3K+ 次浏览
当我们使用 hist 函数在 R 中生成直方图时,x 轴标签会自动生成,但我们可能希望将其更改为研究人员或任何其他机构定义的值。因此,首先我们需要忽略标签创建直方图,然后可以使用 axis 函数输入新值。考虑以下向量 x 并忽略 x 轴标签创建 x 的直方图 - 示例 set.seed(1999) x
2K+ 次浏览
在矩阵分析中可能需要对角线元素的总和,因此,我们可以将矩阵转换为表格并找到对角线元素的总和。这可以使用 sun 函数轻松完成,方法是使用 diag 函数提取表格的对角线元素。例如,如果我们有一个表格 T,则可以将 T 的对角线元素的总和计算为 sum(diag(T))。示例 在线演示 表格1
300 次浏览
通常,我们有多个值、向量或 R 数据框的列需要绘制在单个图形上,以便我们可以同时比较它们或它们之间存在某种关系。因此,我们可以使用 layout 函数和 matrix 函数划分绘图窗口,如下例所示。考虑以下布局和单个值的绘图 - 示例 layout(matrix(c(1, 2, 3, 3, 4, 5, 6, 6), nrow=4, ncol=2, byrow=FALSE)) plot(500) plot(525) plot(530) plot(531) plot(540) plot(528)输出更改布局并创建绘图 - 示例 layout(matrix(c(1, 2, 3, 3, 4, 5, 6, ... 阅读更多
884 次浏览
费舍尔检验帮助我们了解分类变量之间是否存在显著的非随机关系。它应用于列联表,因为这些表用于表示分类变量的频率,我们也可以将其应用于矩阵,因为矩阵具有类似的形式。在 R 中,我们可以使用 fisher.test 函数执行费舍尔检验。示例 在线演示 M1
如果 R 数据框中的一列包含用下划线分隔的字符串值,并且扩展了还包含公共值的列值的尺寸,那么最好一次性从所有值中删除下划线符号以及公共值。这将有助于我们正确读取数据,并简化分析。为此,我们可以使用 gsub 函数。考虑以下数据框 - 示例 在线演示 set.seed(191) ID
如果 R 数据框中有一个分组列,并且我们认为其中一个分组值对我们的分析没有用,那么我们可能希望删除包含该值的所有行并继续进行分析,也可能其中一个值重复出现,我们想将其删除。在这种情况下,我们可以使用否定和单个方括号对数据框进行子集化。示例 在线演示 set.seed(1212) x