当我们使用 `grid.arrange` 连接或组合图表时,即使两个图表中的自变量相同,第一个图表的刻度也会出现在中间作为 X 轴。因此,我们可能希望在连接时去除图表之间的间距,只保留一个 X 轴。这可以通过使用 `theme` 函数来实现。示例请参见以下数据框 - 实时演示set.seed(123) x
有时我们需要创建额外的变量来添加有关现有数据的更多信息,因为它增加了价值。这在我们进行特征工程时尤其常用。如果我们了解到某些可能会影响我们响应的内容,那么我们更倾向于将其作为变量添加到数据中,因此我们根据现有的数据进行补充。例如,根据其他变量应用条件来创建另一个变量,例如,如果频率与某个标准匹配,则为优良程度创建二元变量。示例请参见以下数据框 - 实时演示set.seed(100) Group
当我们使用 R 中的 `hist` 函数创建直方图时,Y 轴标签通常小于直方图的一个或多个条。因此,直方图看起来不太吸引人,并且将 Y 轴值与条形大小匹配变得有些困难。要解决这个问题,我们可以使用 `hist` 函数的 `ylim` 参数,其中可以提供要在 Y 轴标签上绘制的范围。示例请参见以下数据及其直方图 - 实时演示set.seed(101) x
当变量不是连续的而是可以排序时,我们不使用皮尔逊相关系数来查找线性关系,在这种情况下,斯皮尔曼相关系数就出现了。由于斯皮尔曼相关系数考虑值的秩,因此相关性检验忽略相同的秩来查找 p 值,因此我们得到警告“无法用精确 p 值计算具有相同值的 p 值”。这可以通过在 `cor.test` 函数内使用 `exact = FALSE` 来避免。示例请参见以下向量,并执行斯皮尔曼相关性检验以检查它们之间的关系 - 实时演示x1