7000+ 次浏览
要删除列名中的公共后缀,可以使用 gsub 函数。例如,如果我们有一个名为 df 的数据框,其列定义为 x1df、x2df、x3df 和 x4df,那么我们可以使用以下命令从所有列名中删除 df:colnames(df) x1Data x2Data x3Data df1 df1Outputx1Data x2Data x3Data 1 29.26500 26.64124 2.598983 2 21.82170 23.41442 4.134393 3 22.71918 25.21586 4.442823 4 19.88633 25.23487 3.338448 5 20.48989 23.33683 3.829757 6 29.07910 25.54084 3.519393 7 24.28573 23.67258 4.667397 8 27.99849 22.97148 4.100405 9 23.48148 25.36574 2.618030 10 26.39401 23.80191 4.235092 11 29.39867 24.36261 2.782559 12 30.11137 ... 阅读更多
4000+ 次浏览
如果 R 数据框的向量或列中存在 NA 值,则 sd 命令计算标准差的结果将为 NA。要解决此问题,我们需要像处理不包含缺失值的向量一样使用 na.rm=TRUE。例如,如果我们有一个名为 x 的数据框 df 列,其中包含缺失值,则 x 的标准差可以计算为 sd(df$x)。示例考虑以下数据框:在线演示> set.seed(3521) > x df1 df1Outputx 1 NA 2 5.107864 3 4.797851 4 5.184345 5 4.680958 6 5.245151 7 5.760667 ... 阅读更多
3000+ 次浏览
使用 ggplot2 创建的图中,图例的默认位置是右侧,但我们可以使用 theme 函数(它具有 legend.position 参数和 legend.justification 参数)来更改位置。要将图例设置在右上角,我们可以使用 legend.position="top" 和 legend.justification="right"。示例考虑以下数据框:考虑以下数据框:在线演示> x freq df dfOutputx freq 1 Mango 212 2 Guava 220 3 Pomegranate 218加载 ggplot2 包并创建带有图例的条形图:> library(ggplot2) > ggplot(df, aes(x, freq, fill=x))+geom_bar(stat="identity")输出:创建带有图例的条形图,图例位于图表右上角:示例> ggplot(df, aes(x, freq, fill=x))+geom_bar(stat="identity")+theme(legend.position="top", legend.justification="right")输出:阅读更多
500 次浏览
美观是图表最重要的方面之一,因此我们应该尝试在绘图中使用尽可能好的美学属性。在条形图中,我们可以通过多种方式表示条形的中心,其中一种方法是在条形顶部边缘的中心使用点。我们可以使用 geom_point 函数定义颜色参数,以便在使用 ggplot2 创建的条形图中,在条形顶部边缘的中心放置点。示例考虑以下数据框:> freq df dfOutputx freq 1 Mango 212 2 Guava 220 3 ... 阅读更多
314 次浏览
通常,累积和是针对单个变量计算的,在某些情况下基于单个分类变量,很少有情况我们需要对两个分类变量进行计算。如果我们想对两个分类变量进行计算,那么我们需要将数据框转换为 data.table 对象,并使用 cumsum 函数定义包含累积和的列。示例考虑以下数据框:在线演示> set.seed(1361) > Factor1 Factor2 Response df1 df1OutputFactor1 Factor2 Response 1 A T2 9 2 B T1 8 3 B T1 2 4 A T2 3 5 B ... 阅读更多
728 次浏览
要创建一个小写字母向量,我们可以使用单词 letters;对于大写字母,在 R 中使用单词 LETTERS。如果我们想创建一个包含两种类型字母的向量,那么可以使用 c 函数组合这两个单词;如果想创建一个包含小写字母和大写字母随机采样值的向量,则可以使用 sample 函数。示例在线演示> x1 x1Output[1] "A" "B" "C" "D" "a" "b" "c" "d"示例在线演示> x2 x2Output[1] "A" "B" "C" "D" "E" "F" "G" "H" "I" "J" "K" "L" "M" "N" "O" "P" "Q" "R" "S" ... 阅读更多
可以使用 R 中的 replicate 函数重复随机样本。例如,如果我们有一个包含 1、2、3、4、5 的向量,并且我们想重复此随机样本五次,则可以使用 replicate(5, x),输出将是以下形式的矩阵:[,1] [,2] [,3] [,4] [,5] [1,] 1 1 1 1 1 [2,] 2 2 2 2 2 [3,] 3 3 3 3 3 [4,] 4 4 4 4 4 [5,] 5 5 5 5 5示例 1在线演示> x1 x1Output[1] ... 阅读更多
250 次浏览
要查找数值向量的最小值,我们可以直接使用 min 函数,但如果值是用双引号读取的,则 min 函数不起作用。在这种情况下,我们将不得不使用 as.numeric 和向量名称,以便在查找最小值之前将其转换为数值形式。例如,如果我们有一个包含 1、2、3 和 4 的字符向量,则最小值可以计算为 min(as.numeric(x))。示例 1 在线演示 x1
451 次浏览
在掌握数据框后,人们通常会转向 data.table 对象,因为与数据框相比,使用 data.table 对象更容易。我们还需要创建 data.table 对象的子集,这可以通过方括号轻松完成。例如,如果我们有一个名为 DT 的 data.table 对象,其中包含 10 列,并且我们想创建一个包含 1 到 8 列的子集,则可以使用 DT[,−c(9,10),with=FALSE] 来创建该子集。示例 library(data.table) x1
2000+ 次浏览
要组合两个因子向量,我们可以提取两个向量的唯一水平,然后组合这些水平。这可以使用 unique 函数完成。此外,我们可以将原始向量的水平设置为水平的组合,这样,我们可以用缺失的水平完成两个向量。查看下面的示例以了解其工作原理。示例 1 x1