
- 敏捷数据科学教程
- 敏捷数据科学 - 首页
- 敏捷数据科学 - 简介
- 方法论概念
- 敏捷数据科学 - 流程
- 敏捷工具及安装
- 敏捷中的数据处理
- SQL与NoSQL
- NoSQL与数据流编程
- 收集和显示记录
- 数据可视化
- 数据丰富化
- 使用报表
- 预测的作用
- 使用PySpark提取特征
- 构建回归模型
- 部署预测系统
- 敏捷数据科学 - SparkML
- 修复预测问题
- 改进预测性能
- 利用敏捷和数据科学创建更好的场景
- 敏捷的实施
- 敏捷数据科学有用资源
- 敏捷数据科学 - 快速指南
- 敏捷数据科学 - 资源
- 敏捷数据科学 - 讨论
NoSQL和数据流编程
有时,数据无法以关系格式提供,我们需要借助NoSQL数据库来保持其事务性。
在本章中,我们将重点关注NoSQL的数据流。我们还将学习它如何与敏捷和数据科学相结合进行操作。
使用NoSQL与敏捷的主要原因之一是提高与市场竞争的速度。以下原因表明NoSQL如何最适合敏捷软件方法:
更少的障碍
更改当前正在进行的模型在敏捷开发中也需要一些实际成本。使用NoSQL,用户使用聚合数据,而不是浪费时间在规范化数据上。关键是要完成一些事情,并以使模型数据完美为目标。
可扩展性增强
无论何时组织创建产品,它都更关注其可扩展性。NoSQL始终以其可扩展性而闻名,但在设计为水平可扩展性时,它的效果更好。
Learn Data Science in-depth with real-world projects through our Data Science certification course. Enroll and become a certified expert to boost your career.
利用数据的能力
NoSQL是一种无模式数据模型,允许用户轻松使用大量数据,其中包括多个可变性和速度参数。在考虑技术选择时,您应该始终考虑能够更大规模地利用数据的技术。
NoSQL的数据流
让我们考虑以下示例,其中我们展示了如何将数据模型重点放在创建RDBMS模式上。
以下是模式的不同需求:
应列出用户标识。
每个用户至少必须拥有一项技能。
应妥善维护每个用户的经验细节。

用户表已使用3个单独的表进行规范化:
用户
用户技能
用户经验
查询数据库时的复杂性增加,并且随着规范化的增加,时间消耗也随之增加,这对敏捷方法不利。可以使用NoSQL数据库设计相同的模式,如下所示:

NoSQL以JSON格式维护结构,结构轻量级。使用JSON,应用程序可以将具有嵌套数据的对象存储为单个文档。
广告