272 次浏览
我们可能希望找到矩阵列中小于某个值的值的位置。这将有助于我们识别每列中关键值或阈值的位置。例如,如果我们有一个包含 5 行 5 列且值在 1 到 100 范围内的矩阵 M,那么我们可能希望查找每列中小于 50 的值的索引,以便我们了解有多少列具有此类值。在 R 中,我们可以通过... 阅读更多
682 次浏览
因子列的子集化可以通过使用 sapply 创建所有列的对象来完成,使用 is.factor 提取将来的所有因子列,然后将该对象传递到子集运算符单方括号中。例如,如果我们有一个包含三列 x、y、z 的数据框 df,并且其中两列(例如 x 和 y)是因子列,那么我们可以使用 Factors
474 次浏览
通常,散点图中点的默认形状是圆形,但可以使用整数或序列或变量将其更改为其他形状。我们只需要在 geom_point 函数中使用 shape 参数并传递变量名即可。例如,如果我们想要创建具有变量 x 的不同形状的散点图,则可以使用 geom_point(shape=x)。如果我们想要更改大小,则可以使用整数值。示例考虑以下数据框 - 实时演示 set.seed(151) x
21K+ 次浏览
要从矩阵中删除行名或列名,我们只需要将它们设置为 NULL,这样所有名称都将被取消。例如,如果我们有一个包含行名和列名的矩阵 M,那么我们可以使用命令 colnames(M) 删除这些名称
2K+ 次浏览
按行复制矩阵意味着重复一个矩阵一次或多次,但按行进行。例如,如果我们有一个只包含一行三列的矩阵,那么该矩阵复制三次将重复该行三次。这可以通过使用 rep 函数以及 matrix 函数来完成,如下面的示例所示。示例实时演示 M
196 次浏览
如果我们有一系列网站链接,并且我们想从这些链接中提取网站名称,那么这是一项耗时的任务,因为我们需要一个接一个地复制每个名称。因此,最好使用 R 中的函数提取它们并节省时间。要从网站链接中提取网站名称,我们可以使用 urltools 包的 suffix_extract 函数。这将提取主机、子域、域和后缀。众所周知,域值是网站名称。加载 urltools 包 - library(urltools) 网站链接存储在向量中 - Web_Links阅读更多
551 次浏览
为了显示图中自变量的特定部分,我们可能希望使用水平线。这将使图形看起来有所不同并引起观看者的注意。要在图中创建水平线,我们可以使用 geom_line 函数,但我们需要以数据框格式传递我们想要为其创建水平线的值。考虑以下数据框 - 示例实时演示 x
当我们从外部来源导入数据时,标题或列名可能会使用下划线分隔的值导入,如果原始数据具有相同的格式,这也有可能发生。因此,为了使标题更短且看起来更好,我们更愿意删除下划线符号,这可以通过 gsub 函数轻松完成。考虑以下数据框 - 示例实时演示 x_1
917 次浏览
在数据分析中,我们需要非常小心重复的值,因为它们可能是故意输入的,以在数据中创建偏差,这个值也可能是零。当我们有缺失数据并且数据收集者用零替换缺失值时,就会发生这种情况,这是一个错误的做法。要在 R 数据框中查找行级零的频率,我们可以使用 rowSums 函数查找零值,使用以下语法 - rowSums(“data_frame_name”==0) 考虑以下数据框 - 示例实时演示 set.seed(189) x1
6K+ 次浏览
如果 R 数据框的一列中有许多唯一元素或重复元素,并使用该列创建图形(在 X 轴或 Y 轴上),则 R 会自动选择轴标签,这可能不会在图中显示该列的所有唯一值。因此,我们可以根据我们的要求使用 scale_x_continuous 函数或 scale_y_continuous 函数以及标签来显示列值。考虑以下数据框 - 示例实时演示 x