906 次浏览
在基础 R 中,可以使用 plot 函数中的 pch 参数创建具有不同形状点的图形。带有形状的 pch 值列表如下所示:pch = 0 显示正方形 pch = 1 显示圆形 pch = 2 显示向上三角形 pch = 3 显示加号 pch = 4 显示十字 pch = 5 显示菱形 pch = 6 显示向下三角形 pch = 7 显示方形十字 pch = 8 显示星形 pch = 9 显示菱形加号 pch = 10 显示圆形加号 pch = 11 显示向上三角形…… 阅读更多
267 次浏览
如果我们在 R 中的向量中找到唯一值并且它们是重复的,那么我们可以找到这些唯一值的频率,这将有助于我们了解向量中值的分布。根据该分布分析,我们可以进行进一步的分析。这可以使用 rle 函数来完成。示例 在线演示x1
81 次浏览
就像列表可以有多个元素一样,列表的元素也可以有多个子元素,并且这些元素的大小也可能不同,因此也可以有一个包含单个子元素的列表。如果我们有这种类型的列表,那么我们可以使用 order 函数以降序排列该列表,但我们也需要取消列表这些元素。示例考虑以下列表: 在线演示x1
13K+ 次浏览
要创建 R 数据框中所有列的直方图,我们可以使用 Hmisc 包的 hist.data.frame 函数。例如,如果我们有一个包含五列的数据框 df,那么可以使用单行代码 hist.data.frame(df) 创建所有列的直方图。示例考虑以下数据框: 在线演示set.seed(9) x1
413 次浏览
由于列表示变量,我们经常在数据框的列中找到缺失值,但我们也可能希望找到案例的缺失值 (NA),以便我们可以根据案例特征而不是变量的分布来替换它们。在 R 中,我们可以将 rowSums 与 apply 函数一起使用。示例考虑以下数据框: 在线演示set.seed(8) x1
4K+ 次浏览
要查找矩阵每一列的最大值,我们需要使用 apply 函数。例如,如果我们有一个包含 2 行 2 列的矩阵 M,第一行值为 1、2,第二行值为 3、4,那么可以使用语法 apply(M,2,max) 找到该矩阵每一列的最大值,因此结果将是 3、4。示例 在线演示M1−-matrix(1:36,ncol=6) M1输出 [,1] [,2] [,3] [,4] [,5] [,6] [1,] 1 7 13 19 25 31 [2,] 2 8 14 20 26 32 [3,] 3 9 15 21 27 33 [4,] 4 10 16 22 28 34 [5,] 5 11 17 23 29 35 [6,] 6 12 18 24 30 36示例apply(M1,2,max)输出[1] 6 12 18 24 30 36示例 在线演示M2
8K+ 次浏览
中位数是向量中将数据分成两等份的值。要查找所有列的中位数,我们可以使用 apply 函数。例如,如果我们有一个包含数值列的数据框 df,那么所有列的中位数可以计算为 apply(df,2,median)。示例考虑以下数据框: 在线演示set.seed(7) x1
291 次浏览
如果 R 数据框的所有行的值都只有一个,那么我们可能希望删除整列,因为该列的影响在数据分析目标中没有任何意义。因此,我们可以提取包含不同值的列,而不是删除列。示例 在线演示set.seed(1001) x1
498 次浏览
可以使用 predict 函数找到使用回归模型的预测值的置信区间,我们只需要使用 interval 参数进行置信度计算和相应的级别即可。例如,如果我们有一个模型 M,并且自变量的值的数据框命名为 newdata,那么我们可以使用以下语法计算置信区间:predict(M,newdata,se.fit=TRUE,interval="confidence",level=0.95)示例考虑以下数据框: 在线演示set.seed(1234) x1
489 次浏览
数据框可以有多个数值列,我们只需使用带有数据框名称的 boxplot 函数即可为每一列创建箱线图,但如果我们想要排除异常值,则可以使用 outline 参数。例如,如果我们有一个包含异常值的数据框 df,其中包含多个数值列,那么可以将不包含异常值的箱线图创建为 boxplot(df,outline=FALSE)。示例考虑以下数据框: 在线演示set.seed(151) x1