584 次浏览
成对最大值指的是向量之间最大的值。例如,如果我们有一个包含 1、2、3 的向量,以及一个包含 2、1、4 的第二个向量,那么成对最大值将是 2、2、4,因为 1 和 2 之间的最大值是 2,2 和 1 之间的最大值是 2,3 和 4 之间的最大值是 4。在 R 中,我们可以使用 pmax 函数找到许多向量的这些最大值。示例> x1 y1 pmax(x1, y1) [1] 27 28 65 25 17 21 29 > x2 x2 [1] 7 ... 阅读更多
932 次浏览
通常,我们在 R 中从不同的分布模拟随机值。基础 R 提供了一些内置函数来实现这一点,如果我们想将模拟重复固定次数,那么我们会一遍又一遍地编写这些内置函数。但是,借助 replicate 函数,我们可以使用一行代码进行多次模拟,这意味着如果我们想模拟十个均匀随机变量十次,则可以使用 replicate 函数来完成。示例replicate(10, runif(5, 2, 5)) [, 1] [, 2] [, 3] [, 4] [, 5] [, 6] [, 7] [, ... 阅读更多
500 次浏览
累积和用于确定变量或组的总和,并帮助我们了解该变量或组的值随时间的变化。在创建累积和时,我们必须确保总和和最后一个值的累积和(取决于求和的方向)相同。我们可以使用 dplyr 包的 mutate 函数来查找累积和并为其创建一个列。示例考虑以下数据框 -x1
715 次浏览
当我们使用 plot 函数创建图形时,轴标签会根据正在绘制的变量的值自动创建。可以为两个轴(X 轴和 Y 轴)的标签设置限制,这可以通过使用 xlim 和 ylim 选项来实现。例如,如果我们绘制在 X 轴上的变量的范围为 0 到 50,则可以将其设置为 xlim = c(0,50)。示例set.seed(99) x
459 次浏览
创建排名变量是为了将数值变量转换为序数变量。这对于非参数分析很有用,因为如果数值变量的分布不正常,或者参数分析的假设无法由数值变量遵循,那么不会直接分析原始变量值。要使用 mutate 函数创建排名变量,我们可以使用 dense_rank 参数。示例考虑以下数据框 -set.seed(7) x1
1K+ 次浏览
字符串可以是短的也可以是长的,我们也可以在 R 中拥有字符串的向量或列表。当我们要将字符串用于单次或多次比较时,提取部分字符串很常见。如果我们想提取字符串的前两个字符,我们可以使用 substr 函数,语法为 substr(“String_object Or String”,start=1,stop=2)示例x1
箱线图显示最小值、第一四分位数、中位数、第三四分位数和最大值。当我们使用 ggplot2 创建箱线图时,它会显示没有最小值和最大值水平线的箱线图,如果我们想创建水平线,我们可以将 stat_boxplot(geom= 'errorbar') 与 ggplot2 的 ggplot 函数一起使用。示例考虑以下数据框 -set.seed(101) Gender
604 次浏览
散点图是一个图形,其因变量绘制在 Y 轴上,自变量绘制在 X 轴上。有时,因变量和自变量对按某些特征分组,因此,我们可能希望根据特征创建具有不同颜色组的散点图。为此,我们可以在 ggplot 函数中使用 colour 参数。示例考虑以下数据框 -set.seed(123) x
969 次浏览
条形图的条形通常是从下到上垂直的,但我们也可以反转它们。虽然这不是通常的做法,但如果我们想这样做,我们可以做到。为此,我们将不得不反转 Y 轴上的值,结果条形将被反转。这可以通过使用 scale_y_continuous 来实现。示例考虑以下数据框 -Salary_Group
789 次浏览
列表可以包含许多元素,并且每个元素可以是不同类型,但如果它们是数值,则我们可以对它们执行一些数学运算,例如加法、乘法、减法、除法等。为此,我们可以使用 Reduce 函数,通过提及数学运算和列表名称作为 Reduce(“Mathematical_Operation”, List_name)。示例x1