找到 163 篇文章,关于数据科学

使用 purrr 进行函数式编程

Bhuwanesh Nainwal
更新于 2023年1月17日 16:18:23

254 次浏览

函数式编程是一种编程方法,我们通过构造和应用函数来构造程序。更具体地说,在程序中,我们应用的是顺序的纯函数而不是语句。纯函数是一个接受输入并产生一致输出值的函数。此外,在这个过程中不会修改任何增强或输入流。此类函数能够执行单个操作,但为了执行复杂操作,我们可以将它们组合成序列。在本教程中,我们将讨论使用 purr 进行函数式编程。如今,函数式编程因其能够…… 阅读更多

防御性 R 编程

Bhuwanesh Nainwal
更新于 2023年1月17日 14:54:01

338 次浏览

防御性编程是一种软件开发实践,它涉及以一种能够预测和防止错误和漏洞的方式来设计和实现代码。在 R 编程中,防御性编程包括使用技术和策略来确保您的 R 代码健壮、可靠和安全。“防御性”一词可能会让大多数人感到困惑,即它是否意味着编写绝不会失败的代码。但“防御性编程”的实际定义是编写能够正确失败的代码。通过“正确失败”,我们的意思是——如果代码失败,那么它应该…… 阅读更多

处理 R 中的缺失数据

Bhuwanesh Nainwal
更新于 2023年1月17日 16:12:22

29K+ 次浏览

在数据科学中,处理缺失数据是一项常见任务。如果您的数据集中存在缺失数据,则有多种方法可以在 R 编程中处理它。一种方法是简单地删除包含缺失数据的任何行或列。处理缺失数据的另一种方法是使用统计方法估算缺失值。这意味着使用基于数据集中其他值的信息来替换缺失值。例如,我们可以用变量的平均值或中位数来替换缺失值,这些变量中存在缺失值…… 阅读更多

使用 data.table 在 R 中进行数据操作

Bhuwanesh Nainwal
更新于 2023年1月17日 14:17:38

2K+ 次浏览

数据操作是数据分析过程中至关重要的一步,因为它允许我们以适合特定分析或可视化的方式准备和组织数据。根据数据的类型和结构以及操作的具体目标,存在许多不同的数据操作工具和技术。data.table 包是一个 R 包,它提供 R 中 data.frame 类的增强版本。它的语法和功能使操作和处理大型数据集更容易、更快。data.table 是…… 阅读更多

Python 中的数据科学入门

Prabhdeep Singh
更新于 2023年1月11日 11:31:06

681 次浏览

近几十年来,随着世界进入大数据时代,对更有效和更高效的数据存储的需求大大增加。使用大数据的企业会投入大量时间和精力来创建能够容纳大量信息的框架。然后,通过创建像 Hadoop 这样的框架,使得存储大量数据成为可能。由于可以使用这些框架来解决存储问题,因此接下来要解决的问题是如何处理已经存储的数据。处理数据并获取有用信息的解决方案…… 阅读更多

数据科学中的 Git 入门

Prabhdeep Singh
更新于 2023年1月11日 11:20:43

1K+ 次浏览

由于数据科学家正在从事生产系统并加入研发团队,因此数据科学和工程领域越来越多的相互作用。我们希望简化没有工程经验的数据科学家理解核心工程最佳实践。我们正在编写一本关于工程主题的指南,例如 Git、Docker、云基础设施和模型服务,我们听到数据科学从业者正在考虑这些问题。Git 入门 Git 是一种版本控制系统,旨在跟踪对源代码随时间推移所做的更改。如果没有版本控制系统,多个人的协作…… 阅读更多

使用列表和迭代器的 Python 数据科学

Prabhdeep Singh
更新于 2023年1月11日 11:23:00

214 次浏览

数据科学是从大量数据中提取知识和见解的过程,它涉及组织、处理和分析这些数据。它涉及许多不同的领域,包括统计和数学建模、从数据源中提取数据以及数据可视化方法。通常需要使用大数据技术来收集结构化和非结构化数据。在接下来的部分中,我们将研究数据科学的几个应用以及 Python 在这些应用中的用途。Python 是一种广泛使用的、高级的、通用的、面向对象的解释型语言。要将 Python 用于一项任务,只需要…… 阅读更多

Python 数据科学入门

Prabhdeep Singh
更新于 2023年1月11日 11:15:18

242 次浏览

Python 是一种通用的、面向对象的、解释型的高级语言,在市场上非常流行。Python 有一个非常丰富的库,其中包含几乎所有用途的预定义代码,并且只需使用逻辑即可将 Python 用于一项任务,因为大部分编码部分由 Python 本身处理。Python 有一个庞大的开发者社区,这为新手和经验丰富的 Python 用户带来了额外的益处,即不会出现任何错误。在介绍 Python 数据科学之前,让我们先了解一下数据科学的一些基础知识。什么是数据科学?…… 阅读更多

Python 中的数据科学家的软件工程

Prerna Tiwari
更新于 2023年1月9日 16:41:06

234 次浏览

数据科学将数学和统计、专业编程、高级分析、机器学习和人工智能 (AI) 与特定主题专业知识相结合,以揭示隐藏在组织数据中的可行见解。数据科学是所有行业中增长速度最快的领域之一。这是由于数据源和由此产生的数据的数量不断增加。自从数据科学开始获得认可以来,它就在其他学科中引发了争议。在本文中,我们将学习软件工程的基础知识,为什么它…… 阅读更多

使用 Dask 进行并行计算

Prerna Tiwari
更新于 2023年1月9日 16:08:30

493 次浏览

Dask 是一个灵活的开源 Python 库,用于并行计算。在本文中,我们将学习并行计算以及为什么我们应该选择 Dask 来完成此任务。我们将将其与 Spark、Ray 和 Modin 等其他各种库进行比较。我们还讨论了 Dask 的用例。并行计算 并行计算是一种同时执行多个计算或进程的计算类型。大型问题通常会分解成可以单独解决的小块。并行计算的四大类是位级、指令级、数据级和作业并行。…… 阅读更多

广告