87 次查看
pheatmap 函数用于创建聚类热图,但我们可以使用 color 参数更改绘图的美观性,这是 pheatmap 函数的主要功能之一。还有许多其他参数使 pheatmap 与 heatmap 函数区别开来。示例library(pheatmap) M1
452 次查看
如果我们想为两个分类变量创建离散变量总和表,则可以使用 xtabs 函数。输出将是一个列联表或交叉制表表,看起来像一个矩阵。例如,如果我们有一个数据框 df,其中包含两个分类列 x 和 y 以及一个计数列 freq,则可以使用 xtabs(freq~x+y,data=df1) 创建 freq 的总和表。示例考虑以下数据框 − 在线演示x1
223 次查看
要在基础 R 中在箱线图内创建矩形,我们可以在创建箱线图后使用 rect 函数。rect 函数有很多参数,但要创建矩形,只需要前四个参数,它们定义为 xleft - 左 x 位置的向量(或标量)、ybottom - 底 y 位置的向量(或标量)、xright - 右 x 位置的向量(或标量)和 ytop - 顶 y 位置的向量(或标量)。示例 在线演示x
1K+ 次查看
三维数组可以具有不同大小的矩阵,并且它们不一定是正方形或矩形。此外,数组中的所有元素都具有相同的数据类型。如果我们想找到三维数组的均值,则可以使用 apply 函数,我们需要使用组合函数引用数组元素的列和行。示例 在线演示A1 apply(A1,c(1,2),mean) [,1] [,2] [1,] 5 7 [2,] 6 8示例A2
R 数据框中的组列具有重复值,我们可能希望根据值创建一个包含序列号的列,例如第一组的第一个值获得 1,当在同一列中第二次出现相同值时获得 2,依此类推。这可以通过使用 ave 函数来完成,如下面的示例所示。示例考虑以下数据框 − 在线演示序号
347 次查看
如果矩阵中同时包含正值和负值,则矩阵的最大值将为正数,但如果我们想忽略符号,则用负号表示的数字也可以是最大值。如果我们想获得带有符号的最大值,则可以使用 R 中的 which.max 函数。查看下面的示例以了解如何操作。示例 在线演示M1
7K+ 次查看
变量的排名有很多目标,例如根据层次结构定义顺序,但在数据科学中,我们主要将其用于分析非参数数据。可以使用 rank 函数对 R 数据框中的变量进行排名。例如,如果我们有一个包含列 x 的数据框 df,则可以按 rank(df$x) 找到 x 中值的排名。示例 在线演示考虑以下数据框:x1
6K+ 次查看
使用 ggplot2 的 Y 轴刻度标记的默认值由 R 使用提供的数据获取,但我们可以使用 ggplot2 包的 scale_y_continuous 函数设置它。例如,如果我们想要从 1 到 10 的值,间隙为 1,则可以使用 scale_y_continuous(breaks=seq(1,10,by=1))。示例 在线演示考虑以下数据框:x
129 次查看
如果我们想将向量的名称按顺序与另一个向量中具有相同值的字符串向量值匹配,则可以使用 pmatch 函数。pmatch 函数表示模式匹配,因此它匹配所有对应的值并返回这些值的索引。查看下面的示例以了解其工作原理。示例 在线演示x1
10K+ 次查看
重复也是我们在数据分析过程中面临的一个问题。我们可以使用子集函数内的 duplicated 函数查找 R 数据框特定列中具有重复值的列。这将仅返回基于我们选择的列的重复行,这意味着第一个唯一值将不会出现在输出中。示例 在线演示考虑以下数据框:x1