找到 2038 篇文章 关于 R 编程

如何在 R 中进行两个数据框的内连接和外连接?

Nizamuddin Siddiqui
更新于 2020年7月6日 15:00:12

740 次浏览

内连接仅返回左表在右表中具有匹配键的行,而外连接返回两个表中的所有行,连接左表中在右表中具有匹配键的记录。这可以通过使用 merge 函数来实现。示例内连接> df1 = data.frame(CustomerId = c(1:5), Product = c(rep("Biscuit", 3), rep("Cream", 2))) > df1   CustomerId Product 1 1 Biscuit 2 2 Biscuit 3 3 Biscuit 4 4 Cream 5 5 Cream > df2 = data.frame(CustomerId = c(2, 5, 6), City = c(rep("Chicago", 2), rep("NewYorkCity", 1))) > df2 CustomerId City ... 阅读更多

为什么我们应该在 R 中使用 set.seed?

Nizamuddin Siddiqui
更新于 2020年7月6日 14:58:52

5K+ 次浏览

使用 set.seed 的目的是确保我们获得随机化的相同结果。如果我们在 R 或任何统计软件中随机选择一些观察值以执行任何任务,则每次都会产生不同的值,而这是由于随机化造成的。如果我们希望保留在第一次随机选择时产生的值,则可以通过在随机化后将它们存储在对象中来实现,或者我们可以修复随机化过程,以便我们始终获得相同的结果。示例无 set.seed 的随机化> sample(1:10) [1] 4 10 5 3 1 6 ... 阅读更多

如何在 R 中创建数据框列表?

Nizamuddin Siddiqui
更新于 2020年7月6日 14:57:34

225 次浏览

这可以通过使用 list 函数来实现。示例> df1

波浪号运算符 (~) 在 R 中有什么用?

Nizamuddin Siddiqui
更新于 2020年7月11日 12:55:17

3K+ 次浏览

波浪号运算符用于在统计模型公式中定义因变量和自变量之间的关系。波浪号运算符左侧的变量是因变量,波浪号运算符右侧的变量称为自变量。因此,波浪号运算符有助于定义因变量依赖于波浪号运算符右侧的自变量。示例> Regression_Model Regression_Data Regression_Model_New < - lm(y~ . , data = Regression_Data)这将与之前的模型具有相同的输出,但如果我们... 阅读更多

如何在 R 中过滤包含特定字符串的行?

Nizamuddin Siddiqui
更新于 2020年7月6日 14:55:13

1K+ 次浏览

我们可以通过使用 dplyr 包的 filter 和 grepl 函数来实现。示例考虑 mtcars 数据集。> data(mtcars) > head(mtcars) mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2 Valiant 18.1 ... 阅读更多

如何在 R 中使用 ggplot2 更改 x 轴标签的方向和字体大小?

Nizamuddin Siddiqui
更新于 2020年7月6日 14:53:37

869 次浏览

这可以通过在 ggplot2 中使用 theme 参数来实现示例> df df x y 1 long text label a -0.8080940 2 long text label b 0.2164785 3 long text label c 0.4694148 4 long text label d 0.7878956 5 long text label e -0.1836776 6 long text label f 0.7916155 7 long text label g 1.3170755 8 long text label h 0.4002917 9 long text label i 0.6890988 10 long text label j 0.6077572图表创建如下:−> library(ggplot2) > ggplot(df, aes(x=x, y=y)) + geom_point() + theme(text = element_text(size=20), axis.text.x = element_text(angle=90, hjust=1))

如何从 R 数据框中选择仅包含数字的列?

Nizamuddin Siddiqui
更新于 2020年7月6日 14:51:29

886 次浏览

最简单的方法是使用 dplyr 包的 select_if 函数,但我们也可以通过 lapply 来实现。使用 dplyr> df df X1 X2 X3 X4 X5 1 1 11 21 a k 2 2 12 22 b l 3 3 13 23 c m 4 4 14 24 d n 5 5 15 25 e o 6 6 16 26 f p 7 7 17 27 g q 8 8 18 28 h r 9 9 19 29 i s 10 10 20 30 j t >library("dplyr") > select_if(df, is.numeric) X1 X2 X3 1 1 11 21 2 2 12 22 3 3 13 23 4 4 14 24 5 5 15 25 6 6 16 26 7 7 17 27 8 8 18 28 9 9 19 29 10 10 20 30使用 lapply> numeric_only df[ , numeric_only] X1 X2 X3 1 1 11 21 2 2 12 22 3 3 13 23 4 4 14 24 5 5 15 25 6 6 16 26 7 7 17 27 8 8 18 28 9 9 19 29 10 10 20 30

如何在 R 中的 data.table 中按名称删除列?

Nizamuddin Siddiqui
更新于 2020年7月6日 14:50:15

1K+ 次浏览

我们可以通过将列设置为 NULL 来实现示例> library(data.table) > df data_table data_table[, x:=NULL] > data_table numbers 1: 1 2: 2 3: 3 4: 4 5: 5 6: 6 7: 7 8: 8 9: 9 10: 10删除两列> df Data_table Data_table numbers 1: 0 2: 1 3: 2 4: 3 5: 4 6: 5 7: 6 8: 7 9: 8 10: 9

如何在 R 中模拟离散均匀随机变量?

Nizamuddin Siddiqui
更新于 2020年7月11日 12:54:09

4K+ 次浏览

在基础 R 中没有像其他随机变量(如正态、泊松、指数等)那样模拟离散均匀随机变量的函数,但我们可以使用 purrr 包的 rdunif 函数来模拟它。rdunif 函数具有以下语法:−> rdunif(n, b , a)这里,n = 要返回的随机值的数量b = 分布的最大值,它需要是整数,因为分布是离散的a = 分布的最小值,它需要是整数,因为分布是离散的示例假设您想模拟 21 到 ... 阅读更多

如何在 R 数据框中标准化列?

Nizamuddin Siddiqui
更新于 2020年7月6日 14:46:24

216 次浏览

这可以通过使用 scale 函数来实现。示例> data data x y 1 49.57542 2.940931 2 49.51565 2.264866 3 50.70819 2.918803 4 49.09796 2.416676 5 49.90089 2.349696 6 49.03445 3.883145 7 51.29564 4.072614 8 49.11014 3.526852 9 49.41255 3.320530 10 49.42131 3.033730 > standardized_data standardized_data x y [1,] -0.1774447 -0.20927607 [2,] -0.2579076 -1.28232321 [3,] 1.3476023 -0.24439768 [4,] -0.8202493 -1.04137095 [5,] 0.2607412 -1.14768085 [6,] -0.9057468 1.28619932 [7,] 2.1384776 1.58692277 [8,] -0.8038439 0.72069363 [9,] -0.3967165 0.39321942 [10,] -0.3849124 -0.06198639 attr(,"scaled:center") x y 49.707220 3.072784 attr(,"scaled:scale") x y 0.7427788 0.6300430

广告