703 次浏览
有时我们想从数据框中提取计数,这个计数可能是基于行值具有相同特征的列数。例如,如果我们有一个数据框包含三列,五十行,值是1到100之间的整数,那么我们可能想找到每一行中值大于20的列数。这可以使用rowSums函数实现。示例考虑以下数据框 - 在线演示> x1 x2 x3 df df输出 x1 x2 x3 1 9 72 9 2 5 20 ... 阅读更多
1K+ 次浏览
联立方程中的数据可以读作矩阵,然后我们可以求解这些矩阵以找到变量的值。例如,如果我们有三个方程:x + y + z = 6, 3x + 2y + 4z = 9, 2x + 2y – 6z = 3,那么我们将把这些方程转换成矩阵,并使用R中的solve函数求解。示例1 在线演示> A A输出 [, 1] [, 2] [, 3] [1, ] 1 1 2 [2, ] 3 2 4 [3, ] 2 3 -6 在线演示> b ... 阅读更多
172 次浏览
通常,使用ggplot2包创建的图中的网格线彼此之间相隔较远,但有时如果网格线彼此靠近,则图表看起来更好,因此我们可能希望这样做。如果Y轴绘制的是连续变量,则可以通过使用scale_y_continuous设置minor_breaks和breaks来实现。示例考虑以下数据框 - 在线演示> x y df df输出 x y 1 14 16 2 36 1 3 78 18 4 61 6 5 19 11 6 2 40 7 93 23 8 10 13 9 3 21 10 55 31 ... 阅读更多
7K+ 次浏览
要查找R数据框中所有列的均值,我们可以简单地使用colMeans函数,它将返回均值。但是对于标准差,我们没有任何可以直接使用的函数;因此,我们可以将sd与apply一起使用,并引用列来查找R数据框所有列的标准差。例如,如果我们有一个数据框df,那么使用apply函数查找所有列的标准差的语法将是apply(df, 2, sd),这里2指代列。如果我们想... 阅读更多
745 次浏览
当我们从R数据框中获取随机样本时,样本行的行号与原始数据框中的行号相同,这显然是由于随机化造成的。但这可能会在进行分析时造成混淆,尤其是在我们需要使用行的情况下,因此,我们可以将行的索引号转换为从1到所选样本中行数的数字。示例考虑以下数据框 - 在线演示> set.seed(111) > x1 x2 x3 df1 df1输出 x1 x2 x3 1 1.735220712 2.8616625 1.824274 2 1.169264128 2.8469644 ... 阅读更多
189 次浏览
一个向量可能有成千上万个值,每个值可能不同也可能相同。值也可能分组或随机选择,但有一些相似的值。不管向量中的值是什么,要查找一些最大值,我们需要按升序对向量进行排序,然后选择最大值。示例> x1 x1 [1] -1.4447473195 3.2906645299 -0.4680055849 0.1611487482 -0.7715094280 [6] 0.4442103640 0.3702444686 0.0783124252 1.3476432299 1.0140576107 [11] -0.0968917066 0.4628821017 0.3102594626 -0.2946001275 0.1498108166 [16] -0.6002154305 0.5905382364 1.3892651534 0.1008921325 -0.6486318692 [21] -0.0562831933 -0.6887431711 0.4907512082 -0.3994662410 0.7827897030 [26] 0.5294704584 -1.3802965730 -0.6159076490 -0.0009408529 1.6182294859 ... 阅读更多
363 次浏览
数值向量可能包含大量元素;因此,我们可能希望将其转换为区间向量。例如,如果我们在向量中具有1到10的值,那么我们可能希望将其转换为区间向量,例如对于1、2、3、4和5为(1, 5),对于6、7、8、9和10为(6, 10)。这可以使用cut函数完成,我们将在其中使用breaks参数将向量元素组合到区间中。示例 在线演示> x1 x1输出[1] 1 2 3 4 5 6 7 ... 阅读更多
653 次浏览
累积和是连续值的和,我们可以对任何数值向量或R数据框的列进行此求和。但是,如果存在NA,则我们需要跳过它,因此累积和的大小将减少NA值的个数。如果向量中存在NA值,则我们可以使用!is.na在计算累积和时忽略它们,使用cumsum函数。示例 在线演示> x1 x1输出[1] 1 2 3 4 5 6 7 8 9 10 NA > cumsum(x1[!is.na(x1)]) [1] 1 3 6 ... 阅读更多
4K+ 次浏览
十进制值的表达式形式是用除号表示的值的形式。例如,将0.5表示为1/2。在R中,我们可以使用MASS包的fractions函数将十进制值或十进制值向量转换为分数形式。为此,我们只需要将值作为参数传递给fractions函数,例如fractions(“十进制值或十进制值向量”)。加载MASS包 - 示例> library(MASS)输出> fractions(0.14) [1] 7/50 > fractions(1.14) [1] 57/50 > library(MASS) > fractions(0.5) [1] 1/2 > fractions(0.3) [1] 3/10 > fractions(0.31) [1] 31/100 > fractions(1.31) [1] 131/100 > fractions(2.01) [1] 201/100 > ... 阅读更多
196 次浏览
要在使用ggplot2创建的图中添加文本注释,我们可以使用annotate函数。它用于对图进行一些解释或添加任何有助于读者更好地理解图的有用信息。有时,我们可能希望更改带注释文本的角度,尤其是在图中垂直显示某些信息的情况下,因此,我们可以使用annotate函数的角度参数。示例考虑以下数据框 - 在线演示> x y df df输出 x y 1 4.086537 5.890591 2 ... 阅读更多