如果我们有一个长字符串,我们可能想要提取位于两个字符串之间的字符串部分。例如,如果我们有一个字符串“E-learning changing the education system in the world”,并且我们想要提取字符串“the education system”,那么我们必须非常小心地传递字符串函数中的字符串,您可以在示例中了解这一点。使用 gsub 函数提取并不困难,但我们必须确保使用正确的语法,否则结果会变得令人讨厌。示例x1
当我们为数据框计算相关矩阵时,所有列都必须是数值型的,如果不是这种情况,我们会收到错误“Error in cor(“data_frame_name”) : 'x' must be numeric”。为了解决这个问题,我们可以逐个查找变量之间的相关性,或者使用 apply 函数。示例考虑以下数据框 - set.seed(99) x1
R 数据框可以包含数值变量和因子变量。可以看出,原始数据中的因子水平被记录为同义词,即使在不同的语言版本中也是如此,但这很少见。例如,因子变量可以具有热和冷作为水平,但有可能热被说 Hindi 的人记录为 garam,因为 garam 是热的 Hindi 表达方式。因此,我们需要将相似的水平合并为一个,这样我们就不需要为变量设置不必要的因子水平。示例考虑以下数据框 - set.seed(109) x1阅读更多