716 次浏览
一些向量是在 R 中随机创建的,而一些则不是随机创建的,但我们可以对这两种类型的向量进行随机化。随机化确保了无偏性,因此在创建向量时具有改变分析结果的目标时,它是必要的。R 中的随机化可以通过 sample 函数轻松完成。未随机创建的向量的随机化 -> x1 x1 [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 ... 阅读更多
32K+ 次浏览
在 R 中创建包含重复值的向量有两种方法,但它们的方法不同,第一种是重复向量的每个元素,第二种是按指定的次数重复元素。这两种方法都使用 rep 函数来创建向量。示例考虑以下示例 -> x1 x1 [1] 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 [39] 4 ... 阅读更多
11K+ 次浏览
队列是一种抽象数据结构,包含一组元素。队列实现 FIFO 机制,即第一个插入的元素也是第一个删除的元素。队列可以是一种线性数据结构。但是,如果我们使用数组实现队列,可能会产生一些问题。有时,通过一些连续的插入和删除操作,前后位置会发生变化。在那时,它看起来像队列没有空间插入元素。即使有一些空闲空间,由于一些逻辑问题,也不会被使用。为了克服这... 阅读更多
588 次浏览
在数据分析中,在数据框中找到一些 NA 值非常常见,但如果包含 NA 值的列对分析没有用,则所有 NA 值都不会造成问题。我们可以将所有 NA 值替换为 0 或任何其他值,以用于有用的列。示例考虑以下数据框 -> set.seed(99) > x1 x2 x3 x4 x5 df df x1 x2 x3 x4 x5 1 NA NA 25 NA 2 5 2 24 f 2 3 NA ... 阅读更多
483 次浏览
句子中的单词数可用于文本分析,因此,我们需要对其进行计数。这可以针对单个句子或多个句子。我们可以使用 strsplit 和 sapply 查找句子或多个句子中的单词数。示例考虑以下句子作为向量读取 -> x1 x1 [1] "Data Science is actually the Statistical analysis" > sapply(strsplit(x1, " "), length) [1] 7 > x2 x2 [1] "China faced trouble even after controlling COVID-19" > sapply(strsplit(x2, " "), length) [1] 7 > x3 x3 [1] "Corona virus has changed everything ... 阅读更多
1K+ 次浏览
在使用 ggplot2 创建绘图时,绘图区域为正方形,但我们可以通过在 theme 函数中设置 plot.margin 来更改绘图区域。当我们想要减小绘图区域以及数据点较少时,这很有用。示例考虑以下数据框 -> set.seed(1) > x y df library(ggplot2)创建散点图而不更改绘图区域边距 -> ggplot(df,aes(x,y))+ + geom_point()> ggplot(df,aes(x,y))+ + geom_point()+ + theme(plot.margin = unit(c(1,1,1,1), "cm"))> ggplot(df,aes(x,y))+ + geom_point()+ + theme(plot.margin = unit(c(2,2,2,2), "cm"))
通常,R 中的列表包含大量元素,并且每个元素可以是不同的类型,这是列表的一个优点。由于我们可以将数据类型存储为列表元素,因此不同类型数据的存储和选择变得更容易。我们还可以一次选择列表的一个或多个元素。这可以通过使用单个方括号来完成。示例考虑以下列表 -> list_data list_data [[1]] [1] "India" [[2]] [1] "China" [[3]] [1] 21 32 11 [[4]] [1] "a" "b" "c" "d" "e" [[5]] ... 阅读更多
矩阵可以像数据框一样有多行多列。与数据框一样,我们有时需要进行子集选择,矩阵也可能需要这样做。但是,与子集选择数据框相比,子集选择矩阵数据非常简单。示例考虑以下矩阵 -> M M [, 1] [, 2] [, 3] [, 4] [, 5] [1, ] 1 6 11 16 21 [2, ] 2 7 12 17 22 [3, ] 3 8 13 18 23 [4, ] 4 9 14 19 24 [5, ] 5 10 15 20 25子集选择矩阵 M 的列 -> M[, ... 阅读更多
474 次浏览
当存在一个具有不同级别的公共因子时,可以连接数据框,但结果将使用 dplyr 显示所有级别。我们可以使用 left_join 函数连接两个数据框,但如果两个数据框的大小不相同,则第一个数据框的大小必须大于第二个数据框。示例考虑以下数据框 -> Class df1 df1 Class 1 Statistics 2 Maths 3 Chemistry 4 Physics 5 Economics 6 Political Science 7 Geography > Subject Age df2 df2 Subject Age 1 Maths 18 2 Chemistry 21 3 Physics 22 ... 阅读更多
519 次浏览
可以通过使用 R 中的 head 和 tail 函数来选择顶部或底部的元素。当我们想要了解向量中的数据或对部分数据执行某些计算时,需要这样做。示例考虑以下向量,我们将使用 head 和 tail 通过使用正负号来选择这些向量中的顶部和底部元素。它们将具有不同的选择元素的方式。> x x [1] "a" "b" "c" "d" "e" "f" "g" "h" "i" "j" "k" "l" "m" "n" "o" "p" "q" "r" "s" [20] "t" "u" "v" "w" ... 阅读更多