我们为什么应在 R 中使用 set.seed ?


set.seed 的作用是确保我们对随机化获得相同的结果。如果我们在 R 或者任何统计软件中为任何任务随机选择一些观测值,它将一直产生不同的值,这是由于随机化的缘故。如果我们想保留第一次随机选择产生的值,那么我们可以将它们存储在随机化后的对象中,或者我们可以修复随机化过程,以便我们一直得到相同的结果。

示例

无 set.seed 的随机化

> sample(1:10)
[1] 4 10 5 3 1 6 9 2 8 7
> sample(1:10)
[1] 1 4 2 5 8 3 7 9 6 10
> sample(1:10)
[1] 6 3 9 5 10 2 7 1 8 4

这里我们三次创建了样本大小为 10 的样本,而在所有这些样本中值都是不相同的。

带有 set.seed 的随机化

> set.seed(99)
> sample(1:10)
[1] 6 2 10 7 4 5 3 1 8 9
> set.seed(99)
> sample(1:10)
[1] 6 2 10 7 4 5 3 1 8 9
> set.seed(99)
> sample(1:10)
[1] 6 2 10 7 4 5 3 1 8 9

由于我们在所有三个样本中使用了相同的 set.seed,因此我们获得了相同的样本值。

更新于: 2020 年 7 月 6 日

5 千+ 次浏览

开启您的 职业生涯

完成课程以获得认证

开始
广告