703 次浏览
有时我们希望从数据框中提取计数,该计数可能是基于行值具有相同特征的列数。例如,如果我们有一个包含三列和五十行的数
1K+ 次浏览
联立方程中的数据可以读取为矩阵,然后我们可以求解这些矩阵以找到变量的值。例如,如果我们有三个方程如下:-x + y + z = 6 3x + 2y + 4z = 9 2x + 2y – 6z = 3那么我们将把这些方程转换为矩阵,并使用 R 中的 solve 函数求解它们。示例 1 实时演示> A A输出 [, 1] [, 2] [, 3] [1, ] 1 1 2 [2, ] 3 2 4 [3, ] 2 3 -6 实时演示> b ... 阅读更多
172 次浏览
通常,使用 ggplot2 包创建的图上的网格线彼此之间相距较远,但有时如果网格线彼此靠近,则图看起来会更好,因此,我们可能希望这样做。这可以通过设置 scale_y_continuous 中的 minor_breaks 和 breaks 来实现,如果 Y 轴绘制的是连续变量。示例考虑以下数据框 - 实时演示> x y df df输出 x y 1 14 16 2 36 1 3 78 18 4 61 6 5 19 11 6 2 40 7 93 23 8 10 13 9 3 21 10 55 31 ... 阅读更多
7K+ 次浏览
要查找 R 数据框中所有列的平均值,我们可以简单地使用 colMeans 函数,它会返回平均值。但是对于标准差,我们没有任何可以直接使用的函数;因此,我们可以将 sd 与 apply 一起使用并引用列来查找 R 数据框所有列的标准差。例如,如果我们有一个数据框 df,那么使用 apply 函数查找所有列的标准差的语法将是 apply(df, 2, sd),这里 2 指的是列。如果我们想 ... 阅读更多
745 次浏览
当我们从 R 数据框中获取随机样本时,样本行的行号与原始数据框中的行号相同,这显然是由于随机化造成的。但这可能会在进行分析时造成混淆,尤其是在我们需要使用行的情况下,因此,我们可以将行的索引号转换为从 1 到选定样本中行数的数字。示例考虑以下数据框 - 实时演示> set.seed(111) > x1 x2 x3 df1 df1输出 x1 x2 x3 1 1.735220712 2.8616625 1.824274 2 1.169264128 2.8469644 ... 阅读更多
189 次浏览
一个向量可能包含数千个值,并且每个值都可能不同或相同。也可能值可以分组或随机选择,但具有几个相似的值。无论向量中的值如何,要查找一些最大值,我们需要将向量按升序排序,然后选择最大值。示例> x1 x1 [1] -1.4447473195 3.2906645299 -0.4680055849 0.1611487482 -0.7715094280 [6] 0.4442103640 0.3702444686 0.0783124252 1.3476432299 1.0140576107 [11] -0.0968917066 0.4628821017 0.3102594626 -0.2946001275 0.1498108166 [16] -0.6002154305 0.5905382364 1.3892651534 0.1008921325 -0.6486318692 [21] -0.0562831933 -0.6887431711 0.4907512082 -0.3994662410 0.7827897030 [26] 0.5294704584 -1.3802965730 -0.6159076490 -0.0009408529 1.6182294859 ... 阅读更多
363 次浏览
一个数值向量可能包含大量元素;因此,我们可能希望将该向量转换为区间向量。例如,如果我们在向量中具有 1 到 10 的值,那么我们可能希望将该向量转换为区间向量,例如 (1, 5) 用于 1、2、3、4 和 5,以及 (6, 10) 用于 6、7、8、9、10)。这可以通过使用 cut 函数来实现,在该函数中,我们将使用 breaks 参数将向量元素组合到一个区间中。示例 实时演示> x1 x1输出[1] 1 2 3 4 5 6 7 ... 阅读更多
653 次浏览
累积和是连续值的和,我们可以对任何数值向量或 R 数据框的列进行求和。但是,如果存在 NA,则我们需要跳过它,因此累积和的大小将减少 NA 值的数量。如果我们在向量中具有 NA 值,那么我们可以使用 !is.na 在计算累积和时忽略它们,使用 cumsum 函数。示例 实时演示> x1 x1输出[1] 1 2 3 4 5 6 7 8 9 10 NA > cumsum(x1[!is.na(x1)]) [1] 1 3 6 ... 阅读更多
4K+ 次浏览
十进制值的 fractions 形式是用除号表示的值的形式。例如,将 0.5 表示为 1 / 2。在 R 中,我们可以使用 MASS 包的 fractions 函数将十进制值或十进制值向量转换为分数形式。为此,我们只需要将 fractions 函数中的值作为 fractions(“Decimal_value 或 Vector_Of_Decimal_Values”) 传递。加载 MASS 包 - 示例> library(MASS)输出> fractions(0.14) [1] 7/50 > fractions(1.14) [1] 57/50 > library(MASS) > fractions(0.5) [1] 1/2 > fractions(0.3) [1] 3/10 > fractions(0.31) [1] 31/100 > fractions(1.31) [1] 131/100 > fractions(2.01) [1] 201/100 > ... 阅读更多
196 次浏览
要注释 ggplot2 创建的图内的文本,我们可以使用 annotate 函数。它用于对图进行一些解释或添加任何有用的信息,这将帮助读者更好地理解图。有时,我们可能希望更改带注释文本的角度,尤其是在图中以垂直方式呈现某些信息的情况下,因此,我们可以使用 annotate 函数的 angle 参数。示例考虑以下数据框 - 实时演示> x y df df输出 x y 1 4.086537 5.890591 2 ... 阅读更多