977 次浏览
哑变量是一种变量,如果创建哑变量的值存在于数据框中,则取值为 1,否则取值为 0。因此,如果数据框中有一个二元变量,则该变量将有两个哑变量。要创建哑变量,可以使用 model.matrix 函数,如下例所示。请考虑以下数据框 - 示例 在线演示Temp
7K+ 次浏览
二元变量是一种只能取两个可能值的变量,例如性别(男性和女性),国籍(是和否)等。如果二元变量不是 0/1 格式,则可以使用 ifelse 函数将其转换。查看下面的例子以了解其工作原理。请考虑以下数据框 - 示例 在线演示Temp
13K+ 次浏览
要使用 ggplot2 向散点图添加额外点,我们仍然可以使用 geom_point 函数。我们只需要使用 aes 函数用变量的新值进行引用,还可以使用 colour 参数更改此点的颜色。额外点的显示将帮助我们区分阈值/新值和其他值。请考虑以下数据框 - 示例 在线演示x
3K+ 次浏览
要从字符串向量中提取单词,可以使用 stringr 包的 word 函数。例如,如果我们有一个包含 100 个单词的向量 x,则可以使用命令 word(x,start=1,end=20,sep=fixed(" ")) 提取前 20 个单词。如果我们想从任何其他单词开始,则起始值将相应更改。示例 在线演示x
99 次浏览
要查找向量值的回报率,可以使用回报率公式。例如,如果我们有一个名为 x 的向量,则可以使用语法 diff(x)/x[-length(x)] 计算回报率。输出将以十进制形式显示,如果要将其转换为百分比,则需要将输出乘以 100,我们也可以在公式中输入相同的值,例如 (diff(x)/x[-length(x)])*100。示例 在线演示x1
380 次浏览
有时字符串向量中的值在末尾有额外的空格,这可能是在键入值时或由于其他一些手动错误造成的。要删除字符串向量末尾的空格,可以使用 gsub 函数。例如,如果我们有一个名为 x 的向量,其中包含末尾带有空格的字符串值,则可以使用命令 gsub(" $","",x,perl=T) 删除值。示例 在线演示x1
859 次浏览
integer64 向量包含表示带符号整数的向量值,其值范围从负 9,223,372,036,854,775,808 到正 9,223,372,036,854,775,807。要创建 integer64 向量,可以使用 bit64 包的 as.integer64 函数。integer64 向量与其他向量的区别在于可以在向量中存储大量值。示例library(bit64) x1
609 次浏览
pnorm 函数用于查找正态分布随机变量的概率。例如小于平均值、大于平均值或平均值左右两侧之间的概率。如果要对数据框列使用 pnorm 函数,则可以使用 apply 函数。请考虑以下数据框 - 示例 在线演示x1
要使用 ggplot2 手动定义直方图的断点,可以在 geom_histogram 函数中使用 breaks 参数。创建断点数时,必须注意起始点和断点值之间的差值。这将定义直方图的条数,因此应认真对待,应根据数据的分布情况而定。请考虑以下数据框 - 示例 在线演示x
1K+ 次浏览
要使用下一个和上一个值填充 NA 值,可以使用 zoo 包的 na.locf 函数,其中 fromLast = TRUE。这是一种列的情况,如下所示 - x 0 NA NA 1 1 NA 0 1 使用下一个和上一个值填充 NA 值后的输出将为 - x 0 0 0 1 1 1 0 1 请考虑以下数据框 - 示例 在线演示x1