如果我们有一个很长的字符串,我们可能想要提取位于两个字符串之间的字符串部分。例如,如果我们有一个字符串“E-learning changing the education system in the world”,我们想要提取字符串“the education system”,那么我们必须非常小心地在字符串函数中传递字符串,你可以在示例中了解到这一点。使用 gsub 函数提取并不困难,但我们必须确保使用了正确的语法,否则结果会变得令人讨厌。示例x1
当我们为数据框计算相关矩阵时,所有列都必须是数值型的,如果不是这种情况,我们会收到错误消息 Error in cor(“data_frame_name”) : 'x' must be numeric。为了解决这个问题,我们可以逐个查找变量之间的相关性,或者使用 apply 函数。示例考虑以下数据框 - set.seed(99) x1
R 数据框可以包含数字变量和因子变量。据观察,原始数据中的因子水平即使在不同的语言版本中也被记录为同义词,但这很少见。例如,因子变量可以具有 hot 和 cold 作为水平,但可能 hot 被说印地语的人记录为 garam,因为 garam 是 hot 的印地语形式。因此,我们需要将类似的水平组合成一个,这样我们就不会为一个变量拥有不必要的因子水平。示例考虑以下数据框 - set.seed(109) x1阅读更多