7K+ 次浏览
要查找 R 数据框中所有列的均值,我们可以简单地使用 colMeans 函数,它会返回均值。但是对于标准差,我们没有可以直接使用的函数;因此,我们可以将 sd 与 apply 一起使用,并引用列来查找 R 数据框所有列的标准差。例如,如果我们有一个数据框 df,那么使用 apply 函数查找所有列的标准差的语法将是 apply(df, 2, sd),这里 2 指的是列。如果我们想… 阅读更多
745 次浏览
当我们从 R 数据框中获取随机样本时,样本行的行号与原始数据框中的行号相同,显然这是由于随机化造成的。但这可能会在进行分析时造成混淆,尤其是在我们需要使用行的情况下,因此,我们可以将行的索引号转换为从 1 到所选样本中行数的数字。示例考虑以下数据框 - 实时演示> set.seed(111) > x1 x2 x3 df1 df1输出 x1 x2 x3 1 1.735220712 2.8616625 1.824274 2 1.169264128 2.8469644 ... 阅读更多
189 次浏览
一个向量可能包含数千个值,并且每个值都可能不同或相同。也可能值是分组的或随机选择的,但具有几个相似值。无论向量中的值是什么,要查找一些最大值,我们需要按升序对向量进行排序,然后选择最大值。示例> x1 x1 [1] -1.4447473195 3.2906645299 -0.4680055849 0.1611487482 -0.7715094280 [6] 0.4442103640 0.3702444686 0.0783124252 1.3476432299 1.0140576107 [11] -0.0968917066 0.4628821017 0.3102594626 -0.2946001275 0.1498108166 [16] -0.6002154305 0.5905382364 1.3892651534 0.1008921325 -0.6486318692 [21] -0.0562831933 -0.6887431711 0.4907512082 -0.3994662410 0.7827897030 [26] 0.5294704584 -1.3802965730 -0.6159076490 -0.0009408529 1.6182294859 ... 阅读更多
363 次浏览
一个数值向量可能包含大量元素;因此,我们可能希望将其转换为区间向量。例如,如果我们在向量中具有 1 到 10 的值,那么我们可能希望将其转换为区间向量,例如 (1, 5) 用于 1、2、3、4 和 5,以及 (6, 10) 用于 6、7、8、9 和 10)。这可以通过使用 cut 函数来完成,在该函数中,我们将使用 breaks 参数将向量元素组合到一个区间中。示例 实时演示> x1 x1输出[1] 1 2 3 4 5 6 7 ... 阅读更多
653 次浏览
累积和是连续值的总和,我们可以对任何数值向量或 R 数据框的列进行求和。但是如果存在 NA,那么我们需要跳过它,因此累积和的大小将减少 NA 值的数量。如果向量中存在 NA 值,那么在使用 cumsum 函数计算累积和时,我们可以使用 !is.na 忽略它们。示例 实时演示> x1 x1输出[1] 1 2 3 4 5 6 7 8 9 10 NA > cumsum(x1[!is.na(x1)]) [1] 1 3 6 ... 阅读更多
4K+ 次浏览
十进制值的分子形式是用除号表示的值的形式。例如,将 0.5 表示为 1 / 2。在 R 中,我们可以使用 MASS 包的 fractions 函数将十进制值或十进制值向量转换为分数形式。为此,我们只需要将值作为 fractions 函数传递,如 fractions(“Decimal_value 或 Vector_Of_Decimal_Values”)。加载 MASS 包 - 示例> library(MASS)输出> fractions(0.14) [1] 7/50 > fractions(1.14) [1] 57/50 > library(MASS) > fractions(0.5) [1] 1/2 > fractions(0.3) [1] 3/10 > fractions(0.31) [1] 31/100 > fractions(1.31) [1] 131/100 > fractions(2.01) [1] 201/100 > ... 阅读更多
196 次浏览
要注释 ggplot2 创建的绘图内的文本,我们可以使用 annotate 函数。它用于对绘图进行一些解释或添加任何有用的信息,这将帮助读者更好地理解绘图。有时,我们可能希望更改带注释文本的角度,尤其是在我们有一些在绘图中垂直呈现的信息的情况下,因此,我们可以使用 annotate 函数的 angle 参数。示例考虑以下数据框 - 实时演示> x y df df输出 x y 1 4.086537 5.890591 2 ... 阅读更多
440 次浏览
点图是一种直方图,它显示点而不是条形,它用于小型数据集。在 ggplot2 中,我们有 geom_dotplot 函数来创建点图,但我们必须传递正确的 binwidth,它是 geom_dotplot 的一个参数,这样我们才能避免出现警告,警告内容为“警告:忽略未知参数:bins `stat_bindot()` 使用 `bins = 30`。使用 `binwidth` 选择更好的值。”示例考虑以下数据框 - > x df1 library(ggplot2)创建 x 的点图 - > ggplot(df1, aes(x))+geom_dotplot(binwidth=0.2)输出让我们再看一个例子 - > y df2 ggplot(df2, aes(y))+geom_dotplot(binwidth=0.2)输出阅读更多
198 次浏览
百分位数帮助我们确定数据集中位于特定百分比的值。例如,如果我们有一个大小为 100 的向量,其中包含任何值,并假设向量的第十百分位数为 25,这意味着向量中十个百分比的值小于 25,或者我们可以说,向量中九十个百分比的值大于 25。我们可以使用 R 中的 quantile 函数查找向量值的百分位数。示例 实时演示> x1 x1输出[1] 7 1 7 6 6 5 3 1 5 5 4 ... 阅读更多
1K+ 次浏览
在任何大小的矩阵中删除或添加行和列大多是通过使用单个方括号完成的,这也是最简单的方法。要删除行和列,我们只需要使用列索引或行索引,如果我们想删除多个行或列,则可以通过在 c 中插入它们(例如 c(-1, -2))用逗号分隔它们。如果我们想按顺序删除多行或多列,则可以使用冒号。示例 实时演示> M M输出 [, 1] [, 2] [, 3] [, ... 阅读更多