269 次浏览
当我们在 R 中应用 summary 函数时,输出结果会给出最小值、第一四分位数、中位数、平均值、第三四分位数和最大值,但是还有许多其他基本统计值可以帮助我们理解变量,例如极差、总和、平均值的标准误差、方差、标准差和变异系数。因此,如果我们想找到所有这些值,可以使用 pastecs 包的 stat.desc 函数,如下例所示。示例 1 请考虑以下数据框 - 在线演示 > x1 x2 x3 df1 df1 输出 x1 x2 x3 ... 阅读更多
5K+ 次浏览
要将列值转换为列名,我们可以使用 reshape2 包的 dcast 函数。例如,如果我们有一个名为 df 的数据框,它包含两列,例如 x 和 y,其中 x 是分类变量,y 是数值变量。现在,如果我们想将 x 中的类别作为列名,则可以使用 dcast(df, y~x) 来完成。示例 1 请考虑以下数据框 - 在线演示 > x1 x2 df1 df1 输出 x1 x2 1 B 4 2 A 2 3 A 5 4 C 3 5 A 7 6 A 4 7 ... 阅读更多
605 次浏览
要查找按行的变量总和,是指数据框中行值之和。这可以使用 rowSums 函数轻松完成。例如,如果我们有一个名为 df 的数据框,则可以使用以下命令找到按行的变量总和:rowSums(df) 示例 1 请考虑以下数据框 - 在线演示 > x1 x2 x3 df1 df1 输出 x1 x2 x3 1 0 2 3 2 1 0 1 3 1 0 2 4 3 3 2 5 4 2 2 6 3 1 5 7 ... 阅读更多
730 次浏览
表格中的比例总计有助于我们了解每一行和每一列对总计的贡献。因此,如果我们想在边际处找到比例总计,如果我们有比例表,则可以使用 addmargins 函数;如果我们没有该表,则首先需要创建它,然后使用 addmargins 函数。例如,如果我们有一个名为 prop 的比例表,则命令将为 addmargins(prop)。示例 1 请考虑以下比例表 - 在线演示 > x1 x2 x3 x4 x5 x6 x7 x8 table1 table1 输出 ... 阅读更多
1K+ 次浏览
当我们想对数据框的列应用 t 检验时,我们通常会通过访问相应的列来逐一执行它们,但如果我们想对数据框的所有列应用检验,则可以使用 sapply 函数。例如,如果我们有一个名为 df 的数据框,它包含多列,则可以使用命令 sapply(df, t.test) 将单样本检验应用于所有列。示例 1 请考虑以下数据框 - 在线演示 > x1 x2 x3 df1 df1 输出 x1 x2 ... 阅读更多
741 次浏览
当我们在基本 R 中创建条形图时,条形图会针对向量中的所有值绘制,但是如果我们在值中存在间隙,则不会绘制该间隙的零频率条形图。例如,如果我们有一个名为 x 的向量,其中包含 100 个值,包括 0、1、3,则条形图不会表示 2 的零频率。要解决此问题,我们可以在 barplot 函数中使用 factor 函数,如下例所示。示例 1 在线演示 > x x 输出 [1] 0 1 1 1 3 1 3 1 0 ... 阅读更多
4K+ 次浏览
要将数据框的行绘制为线,我们可以使用 matplot 函数,但是我们需要转置数据框,因为数据框的转置值将被读取为列,而 matplot 函数绘制的是列而不是行。例如,如果我们有一个名为 df 的数据框,则可以使用以下命令创建行作为线的图:matplot(t(df), type="l") 示例 1 请考虑以下数据框 - 在线演示 > x1 x2 x3 df1 df1 输出 x1 x2 x3 1 0 9 5 2 3 4 2 3 0 2 1 4 3 7 3 ... 阅读更多
2K+ 次浏览
要查找数据框列的 log10,将使用 log10 函数,但是要查找 log10 的反函数,可以通过将 10 提升到 log10 列的幂来找到。例如,如果我们有一个名为 df 的数据框,它包含一列 x,则 log10 将使用 log10(df$x) 找到,之后将使用 10^(df$x) 找到反函数。示例 1 请考虑以下数据框 - 在线演示 > x1 x2 df1 df1 输出 x1 x2 1 66210 2 2 42033 2 3 39309 2 4 80353 3 5 92864 2 6 48621 ... 阅读更多
984 次浏览
要按相等和不同的元素数量分割向量,我们可以将 split 函数与 rep 函数一起使用。rep 函数将定义相等和不同元素数量的分割重复。例如,如果一个向量(例如 x)包含 50 个值,则将 x 分割成不同数量的元素(如 20、10、10、5、5),这可以通过使用命令 split(x, rep(1:5, c(20, 10, 10, 5, 5))) 来完成。示例 1 在线演示 > x1 x1 输出 [1] 1.30316414 -0.80488291 0.23170812 -0.07318560 -0.73388857 -0.85952329 [7] -0.88713465 -0.26618866 1.45634603 0.31282735 1.39285785 0.32501145 [13] -1.72088389 -0.20699097 -0.37173907 0.03042574 ... 阅读更多
363 次浏览
为了从R的data.table对象中另一个列的组内最大值中提取行,可以使用`which.max`函数并定义分组列。这意味着,如果我们有一个类别/分组列和一个数值列,那么组内最大值将是数值列中每个分组级别下的最大值,我们可以根据这两列提取行。查看示例以了解其工作原理。示例1加载data.table包并创建一个data.table对象 −> library(data.table) > x1 x2 x3 DT1 DT1输出 x1 x2 x31: B 3 2 2: C 6 0 ... 阅读更多