有时我们需要创建额外的变量来添加有关现有数据的更多信息,因为它会增加价值。这在我们进行特征工程时尤其有用。如果我们了解到某些可能会影响我们响应的事物,那么我们更倾向于将其作为数据中的变量使用,因此我们根据我们拥有的数据来构建它。例如,根据其他变量应用条件创建另一个变量,例如,如果频率匹配某个标准,则为优良创建二元变量。示例请考虑以下数据框 - 实时演示set.seed(100) Group
在任何软件或编程语言中,任何二维图形的轴标题的默认位置都是 X 轴的底部和 Y 轴的左侧,但我们可能需要将这些标题的位置分别更改为顶部和右侧。这可以通过使用 ggplot2 包的 scale_x_continuous(position="top") 和 scale_y_continuous(position="right") 函数来完成。示例请考虑以下数据框 - 实时演示set.seed(101) x