找到 2038 篇文章 适用于 R 编程

使用 data.table 在 R 中连接数据

Bhuwanesh Nainwal
更新于 2023年1月17日 15:06:04

2K+ 浏览量

在本文中,我们将讨论使用 data.table 包在 R 中连接数据。术语“连接数据”是指执行不同类型的连接操作,例如两个或多个表之间的内部连接、左外部连接、右外部连接和全外部连接。在表之间执行连接操作的主要目的是根据某些属性(或列)条件访问多个表中的数据。R 为我们提供了 data.table 包,借助该包,我们可以非常有效地处理表格数据(具有行和列)。该包作为替代方案推出... 阅读更多

使用 purrr 进行函数式编程

Bhuwanesh Nainwal
更新于 2023年1月17日 16:18:23

254 浏览量

函数式编程是一种编程方法,其中我们通过构建和应用函数来构建程序。更具体地说,在程序中,我们应用顺序纯函数而不是语句。纯函数是一个接受输入并产生一致值作为输出的函数。此外,在此过程中不会修改任何增强或输入流。此类函数能够执行单个操作,但为了执行复杂操作,我们可以将其组合成序列。在本教程中,我们将讨论使用 purr 进行函数式编程。如今,函数式编程由于其能够... 阅读更多

防御性 R 编程

Bhuwanesh Nainwal
更新于 2023年1月17日 14:54:01

338 浏览量

防御性编程是一种软件开发实践,它涉及以一种预期和防止错误和漏洞的方式设计和实现代码。在 R 编程中,防御性编程涉及使用技术和策略来确保您的 R 代码健壮、可靠和安全。对于防御性编程中的“防御性”一词,你们中的大多数人可能会对它是否意味着编写永远不会失败的代码感到困惑。但“防御性编程”的实际定义是编写正确失败的代码。“正确失败”是指 - 如果代码失败,则应... 阅读更多

处理 R 中的缺失数据

Bhuwanesh Nainwal
更新于 2023年1月17日 16:12:22

29K+ 浏览量

在数据科学中,处理缺失数据是一项常见任务之一。如果您的数据集中存在缺失数据,则有多种方法可以在 R 编程中处理它。一种方法是简单地删除包含缺失数据的任何行或列。处理缺失数据的另一种方法是使用统计方法对缺失值进行插补。这意味着使用基于数据集中其他值进行估计来替换缺失值。例如,我们可以用找到缺失值的变量的平均值或中位数来替换缺失值。... 阅读更多

使用 data.table 在 R 中进行数据操作

Bhuwanesh Nainwal
更新于 2023年1月17日 14:17:38

2K+ 浏览量

数据操作是数据分析过程中的一个关键步骤,因为它允许我们以适合特定分析或可视化的方式准备和组织数据。根据数据类型和结构以及操作的具体目标,有许多不同的数据操作工具和技术。data.table 包是 R 包,它提供了 R 中 data.frame 类的增强版本。它的语法和功能使操作和处理大型数据集变得更容易和更快。date.table 是一个... 阅读更多

如何在 R 矩阵中找到移动标准差?

Nizamuddin Siddiqui
更新于 2021年11月23日 06:52:55

318 浏览量

在矩阵中找到移动标准差的方式与在数据框中相同,我们只需要使用矩阵对象名称代替数据框名称。因此,我们可以为此目的使用 zoo 包的 rollapply 函数。例如,如果我们有一个名为 M 的矩阵,并且我们想找到 2 个移动标准差,那么我们可以使用以下命令:rollapply(M,width=2,FUN=sd,fill=0,align="r")示例 1以下代码段创建一个矩阵:M1

如何在 R 中舍入摘要输出?

Nizamuddin Siddiqui
更新于 2021年11月23日 06:49:16

4K+ 浏览量

要舍入 R 中 summary 函数的输出,我们可以在应用 summary 函数时使用 digits 参数。例如,如果我们有一个名为 df 的数据框,然后要找到输出中带有两位数字的汇总统计信息,我们可以使用以下命令:summary(df, digits=2)示例 1以下代码段创建一个数据框:head(iris, 20) 创建了以下数据框:Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 ... 阅读更多

如何在 R 中查找 n 个列的行总和?

Nizamuddin Siddiqui
更新于 2021年11月23日 06:36:30

3K+ 浏览量

可以使用 rowSums 函数以及使用单个方括号对列进行子集选择来找到 n 个列的行总和。例如,如果我们有一个名为 df 的数据框,其中包含 5 列,并且我们想查找最后 3 列的行总和,则可以使用以下命令:df$Sum_3

如何在 R 中从命名向量中提取最大值?

Nizamuddin Siddiqui
更新于 2021年11月23日 06:31:08

907 浏览量

要从 R 中的命名向量中提取最大值,我们可以使用 which.max 函数。例如,如果我们有一个名为 X 的向量,它是一个命名向量,那么我们可以使用以下命令在 X 中查找最大值。X[which.max(X)]查看以下示例以了解其工作原理。示例 1以下代码段创建一个向量:x1

如何在 R 中使用 ggplot2 减少 Y 轴值和刻度之间的间距?

Nizamuddin Siddiqui
更新于 2021年11月23日 06:21:07

5K+ 浏览量

要使用 ggplot2 减少轴值和刻度之间的间距,我们可以使用 ggplot2 包的 theme 函数,并将 margin 设置为 0。例如,如果我们有一个名为 df 的数据框,其中包含两列,例如 x 和 y,那么可以通过使用以下命令创建 x 和 y 之间的散点图,并在 Y 轴值和刻度之间减少间距:ggplot(df,aes(x,y))+geom_point()+theme(axis.text.y=element_text(margin=margin(r=0)))示例以下代码段创建一个样本数据框:x

广告