
- 敏捷数据科学教程
- 敏捷数据科学 - 首页
- 敏捷数据科学 - 简介
- 方法论概念
- 敏捷数据科学 - 流程
- 敏捷工具与安装
- 敏捷中的数据处理
- SQL 与 NoSQL
- NoSQL 与数据流编程
- 收集和显示记录
- 数据可视化
- 数据丰富
- 使用报表
- 预测的作用
- 使用 PySpark 提取特征
- 构建回归模型
- 部署预测系统
- 敏捷数据科学 - SparkML
- 修复预测问题
- 提高预测性能
- 通过敏捷和数据科学创造更好的场景
- 敏捷的实施
- 敏捷数据科学有用资源
- 敏捷数据科学 - 快速指南
- 敏捷数据科学 - 资源
- 敏捷数据科学 - 讨论
敏捷数据科学 - SQL 与 NoSQL
本教程的完整重点是遵循敏捷方法,减少步骤,并实施更多有用的工具。要理解这一点,了解 SQL 和 NoSQL 数据库之间的区别非常重要。
大多数用户都了解 SQL 数据库,并且对 MySQL、Oracle 或其他 SQL 数据库有很好的了解。在过去的几年里,NoSQL 数据库已被广泛采用,以解决各种业务问题和项目需求。

下表显示了 SQL 和 NoSQL 数据库之间的区别:
SQL | NoSQL |
---|---|
SQL 数据库主要被称为关系数据库管理系统 (RDBMS)。 | NoSQL 数据库也称为面向文档的数据库。它是非关系型和分布式的。 |
基于 SQL 的数据库包含具有行和列的表结构。表的集合和其他模式结构称为数据库。 | NoSQL 数据库包含文档作为主要结构,文档的集合称为集合。 |
SQL 数据库包含预定义的模式。 | NoSQL 数据库具有动态数据,并包含非结构化数据。 |
SQL 数据库是垂直可扩展的。 | NoSQL 数据库是水平可扩展的。 |
SQL 数据库非常适合复杂的查询环境。 | NoSQL 没有用于复杂查询开发的标准接口。 |
SQL 数据库不适用于分层数据存储。 | NoSQL 数据库更适合分层数据存储。 |
SQL 数据库最适合指定应用程序中的大量事务。 | NoSQL 数据库在复杂事务应用程序的高负载下仍不被认为具有可比性。 |
SQL 数据库提供其供应商的出色支持。 | NoSQL 数据库仍然依赖于社区支持。只有少数专家可用于设置和部署大规模 NoSQL 部署。 |
SQL 数据库侧重于 ACID 属性 - 原子性、一致性、隔离性和持久性。 | NoSQL 数据库侧重于 CAP 属性 - 一致性、可用性和分区容错性。 |
SQL 数据库可以根据选择它们的供应商分类为开源或闭源。 | NoSQL 数据库根据存储类型进行分类。NoSQL 数据库默认是开源的。 |
为什么敏捷选择 NoSQL?
上述比较表明,NoSQL 文档数据库完全支持敏捷开发。它是无模式的,并且不完全专注于数据建模。相反,NoSQL 推迟了应用程序和服务,因此开发人员可以更好地了解如何对数据进行建模。NoSQL 将数据模型定义为应用程序模型。

MongoDB 安装
在本教程中,我们将更多地关注 MongoDB 的示例,因为它被认为是最好的“NoSQL 模式”。




广告