1K+ 阅读量
要检查一个字符串是否为另一个字符串的子集,我们可以使用 grepl 函数。例如> Company Job grepl(Job, Company, fixed = TRUE) [1] TRUE这里我们得到 TRUE,因为 Tutor 是 TutorialsPoint 的子集。> grepl(Company, Job, fixed = TRUE) [1] FALSE这里我们得到 FALSE,因为 TutorialsPoint 不是 Tutor 的子集。
这可以通过使用 tail 函数来实现。例如> x tail(x,n=1) [1] 1095 > data tail(data,n=1) Class 10 PhD df = data.frame(matrix(rnorm(20), nrow=5)) > tail(df,n=1) X1 X2 X3 X4 5 -0.3595053 0.9943738 0.959761 -0.6565688 > tail(df$X4,n=1) [1] -0.6565688
404 阅读量
我们可以使用 options(scipen=999) 来实现。例如> x t.test(x, mu=2000)单样本 t 检验数据:x t = -14.212,df = 9,p 值 = 1.801e-07备择假设:真实均值不等于 200095% 置信区间 -151.3501 659.0499样本估计 -x 的均值 405.2这里 p 值以科学计数法表示。现在我们可以将其停用,如下所示 -> options(scipen=999) > t.test(x, mu=2000)单样本 t 检验数据:x t = -14.212,df = 9,p 值 = 0.0000001801备择假设:真实均值不等于 200095% 置信区间 -151.3501 659.0499样本估计 -x 的均值 405.2如果我们想再次激活科学计数法,则可以… 阅读更多
这可以通过按照我们想要的顺序设置变量的级别来实现。例如> data data ggplot(data, aes(x = Class)) + geom_bar()按升序设置级别> data
197 阅读量
列的重新排序可以通过使用方括号来实现。例如> df = data.frame(matrix(rnorm(20), nrow=5)) > df X1 X2 X3 X4 1 -0.3637644 2.0770246 0.48763128 -0.09019256 2 -3.1758515 2.3173075 0.86846761 0.38396459 3 1.1844641 0.3412267 1.90986295 -1.03493074 4 -0.5953466 1.7211738 -0.90686896 -0.71215313 5 -0.8732530 0.3256303 0.02312328 -0.36993899假设我们想将列的顺序更改为 X3、X2、X4 和 X1,则可以按如下所示完成 -> df[,c(3,2,4,1)] X3 X2 X4 X1 1 0.48763128 2.0770246 -0.09019256 -0.3637644 2 0.86846761 2.3173075 0.38396459 -3.1758515 3 1.90986295 0.3412267 -1.03493074 1.1844641 4 -0.90686896 1.7211738 -0.71215313 -0.5953466 5 0.02312328 0.3256303 -0.36993899 -0.8732530
729 阅读量
有三种方法可以查找向量中元素的索引。例如> x x [1] 8 10 9 6 2 1 4 7 5 3使用 which> which(x == 6)[[1]] [1] 4这里我们找到了向量 x 中 6 的索引。使用 match> match(c(4,8),x) [1] 7 1这里我们找到了向量 x 中 4 和 8 的索引。使用 which 和 %in%> which(x %in% c(2,4)) [1] 5 7这里我们找到了向量 x 中 2 和 4 的索引。
330 阅读量
这可以通过简单地使用 sample 函数来实现。例如> df = data.frame(matrix(rnorm(20), nrow=5)) > df X1 X2 X3 X4 1 -0.3277833 -0.1810403 0.2844406 -2.9676440 2 0.8262923 0.4334449 0.4031084 -1.9278049 3 -0.1769219 -0.1583660 -0.2829540 -0.1962654 4 1.0357773 0.9326049 0.3250011 -1.8835882 5 -1.0682642 -0.6589731 -0.4783144 -0.2945062假设我们想随机选择 3 行,则可以按如下所示完成 -> df[sample(nrow(df), 3), ] X1 X2 X3 X4 2 0.8262923 0.4334449 0.4031084 -1.9278049 1 -0.3277833 -0.1810403 0.2844406 -2.9676440 5 -1.0682642 -0.6589731 -0.4783144 -0.2945062
159 阅读量
我们可以通过定义新名称来实现,如下所示 -> Samp Samp sample.1.100..10. 1 47 2 63 3 57 4 16 5 53 6 7 7 54 8 2 9 13 10 14 > colnames(Samp) Samp Sampled Values 1 47 2 63 3 57 4 16 5 53 6 7 7 54 8 2 9 13 10 14由于数据框中只有一列,因此使用对象名称就足够了。
350 阅读量
在数字前添加零最简单的方法是使用 paste0 函数例如> ID Gender Lens data data ID Gender Lens 1 25499 1 0.8 2 25500 2 1.2 3 25501 2 1.0 4 25502 1 2.0 5 25503 2 1.8 6 25504 1 1.4假设我们想要在每个 ID 前添加 00。这可以通过使用 paste0 函数来实现,如下所示 -> IDs newdata newdata IDs Gender Lens 1 0025499 1 0.8 2 0025500 2 1.2 3 0025501 2 1.0 4 0025502 1 2.0 5 0025503 2 1.8 6 0025504 1 1.4
2K+ 阅读量
这可以通过使用 aggregate 函数或借助 tapply 来实现例如> x x Category Frequency 1 Graduation 12 2 Graduation 19 3 Post-Graduation 15 4 Graduation 20 5 PhD 25 6 Post-Graduation 13 7 PhD 14使用 aggregate> aggregate(x$Frequency, by=list(Group=x$Category), FUN=sum) Group x 1 Graduation 51 2 PhD 39 3 Post-Graduation 28使用 tapply > tapply(x$Frequency, x$Category, FUN=sum) Graduation PhD Post-Graduation 51 39 28