找到 2038 篇文章 关于 R 编程

如何在 R 中对两个数据框进行内连接和外连接?

Nizamuddin Siddiqui
更新于 2020-07-06 15:00:12

740 次浏览

内连接仅返回左表在右表中具有匹配键的行,而外连接返回两个表中的所有行,连接左表中在右表中具有匹配键的记录。这可以通过使用 merge 函数来完成。示例内连接> df1 = data.frame(CustomerId = c(1:5), Product = c(rep("Biscuit", 3), rep("Cream", 2))) > df1   CustomerId Product 1 1 Biscuit 2 2 Biscuit 3 3 Biscuit 4 4 Cream 5 5 Cream > df2 = data.frame(CustomerId = c(2, 5, 6), City = c(rep("Chicago", 2), rep("NewYorkCity", 1))) > df2 CustomerId City ... 阅读更多

为什么我们应该在 R 中使用 set.seed?

Nizamuddin Siddiqui
更新于 2020-07-06 14:58:52

5K+ 次浏览

使用 set.seed 是为了确保我们获得随机化的相同结果。如果我们在 R 或任何统计软件中随机选择一些观察结果以执行任何任务,则会导致每次产生不同的值,而这正是由于随机化造成的。如果我们想保留第一次随机选择产生的值,那么我们可以通过在随机化后将它们存储在对象中来实现,或者我们可以修复随机化过程,以便始终获得相同的结果。示例无 set.seed 的随机化> sample(1:10) [1] 4 10 5 3 1 6 ... 阅读更多

如何在 R 中创建数据框列表?

Nizamuddin Siddiqui
更新于 2020-07-06 14:57:34

225 次浏览

这可以通过使用 list 函数来完成。示例> df1

波浪号运算符 (~) 在 R 中有什么作用?

Nizamuddin Siddiqui
更新于 2020-07-11 12:55:17

3K+ 次浏览

波浪号运算符用于在统计模型公式中定义因变量和自变量之间的关系。波浪号运算符左侧的变量是因变量,波浪号运算符右侧的变量称为自变量。因此,波浪号运算符有助于定义因变量取决于波浪号运算符右侧的自变量。示例> Regression_Model Regression_Data Regression_Model_New < - lm(y~ . , data = Regression_Data)这将与上一个模型具有相同的输出,但如果我们不能将波浪号与点一起使用... 阅读更多

如何在 R 中筛选包含特定字符串的行?

Nizamuddin Siddiqui
更新于 2020-07-06 14:55:13

1K+ 次浏览

我们可以通过使用 dplyr 包的 filter 和 grepl 函数来实现。示例考虑 mtcars 数据集。> data(mtcars) > head(mtcars) mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2 Valiant 18.1 ... 阅读更多

如何在 R 中使用 ggplot2 更改 x 轴标签的方向和字体大小?

Nizamuddin Siddiqui
更新于 2020-07-06 14:53:37

869 次浏览

这可以通过在 ggplot2 中使用 theme 参数来完成示例> df df x y 1 long text label a -0.8080940 2 long text label b 0.2164785 3 long text label c 0.4694148 4 long text label d 0.7878956 5 long text label e -0.1836776 6 long text label f 0.7916155 7 long text label g 1.3170755 8 long text label h 0.4002917 9 long text label i 0.6890988 10 long text label j 0.6077572图表创建如下 −> library(ggplot2) > ggplot(df, aes(x=x, y=y)) + geom_point() + theme(text = element_text(size=20), axis.text.x = element_text(angle=90, hjust=1))

如何在 R 数据框中仅选择数值列?

Nizamuddin Siddiqui
更新于 2020-07-06 14:51:29

886 次浏览

最简单的方法是使用 dplyr 包的 select_if 函数,但我们也可以通过 lapply 来实现。使用 dplyr> df df X1 X2 X3 X4 X5 1 1 11 21 a k 2 2 12 22 b l 3 3 13 23 c m 4 4 14 24 d n 5 5 15 25 e o 6 6 16 26 f p 7 7 17 27 g q 8 8 18 28 h r 9 9 19 29 i s 10 10 20 30 j t >library("dplyr") > select_if(df, is.numeric) X1 X2 X3 1 1 11 21 2 2 12 22 3 3 13 23 4 4 14 24 5 5 15 25 6 6 16 26 7 7 17 27 8 8 18 28 9 9 19 29 10 10 20 30使用 lapply> numeric_only df[ , numeric_only] X1 X2 X3 1 1 11 21 2 2 12 22 3 3 13 23 4 4 14 24 5 5 15 25 6 6 16 26 7 7 17 27 8 8 18 28 9 9 19 29 10 10 20 30

如何在 R 的 data.table 中按名称删除列?

Nizamuddin Siddiqui
更新于 2020-07-06 14:50:15

1K+ 次浏览

我们可以通过将列设置为 NULL 来实现示例> library(data.table) > df data_table data_table[, x:=NULL] > data_table numbers 1: 1 2: 2 3: 3 4: 4 5: 5 6: 6 7: 7 8: 8 9: 9 10: 10要删除两列> df Data_table Data_table numbers 1: 0 2: 1 3: 2 4: 3 5: 4 6: 5 7: 6 8: 7 9: 8 10: 9

如何在 R 中模拟离散均匀随机变量?

Nizamuddin Siddiqui
更新于 2020-07-11 12:54:09

4K+ 次浏览

在基础 R 中没有像正态、泊松、指数等其他随机变量那样用于模拟离散均匀随机变量的函数,但我们可以使用 purrr 包的 rdunif 函数来模拟它。rdunif 函数具有以下语法 −> rdunif(n, b , a)这里,n = 要返回的随机值的数量b = 分布的最大值,它需要是整数,因为分布是离散的a = 分布的最小值,它需要是整数,因为分布是离散的示例假设您想模拟 21 到... 阅读更多

如何在 R 数据框中标准化列?

Nizamuddin Siddiqui
更新于 2020-07-06 14:46:24

216 次浏览

这可以通过使用 scale 函数来完成。示例> data data x y 1 49.57542 2.940931 2 49.51565 2.264866 3 50.70819 2.918803 4 49.09796 2.416676 5 49.90089 2.349696 6 49.03445 3.883145 7 51.29564 4.072614 8 49.11014 3.526852 9 49.41255 3.320530 10 49.42131 3.033730 > standardized_data standardized_data x y [1,] -0.1774447 -0.20927607 [2,] -0.2579076 -1.28232321 [3,] 1.3476023 -0.24439768 [4,] -0.8202493 -1.04137095 [5,] 0.2607412 -1.14768085 [6,] -0.9057468 1.28619932 [7,] 2.1384776 1.58692277 [8,] -0.8038439 0.72069363 [9,] -0.3967165 0.39321942 [10,] -0.3849124 -0.06198639 attr(,"scaled:center") x y 49.707220 3.072784 attr(,"scaled:scale") x y 0.7427788 0.6300430

广告