
- 敏捷数据科学教程
- 敏捷数据科学 - 首页
- 敏捷数据科学 - 简介
- 方法论概念
- 敏捷数据科学 - 流程
- 敏捷工具与安装
- 敏捷中的数据处理
- SQL 与 NoSQL
- NoSQL 与数据流编程
- 收集与显示记录
- 数据可视化
- 数据丰富化
- 使用报表
- 预测的作用
- 使用 PySpark 提取特征
- 构建回归模型
- 部署预测系统
- 敏捷数据科学 - SparkML
- 修复预测问题
- 改进预测性能
- 使用敏捷和数据科学创建更好的场景
- 敏捷的实施
- 敏捷数据科学有用资源
- 敏捷数据科学 - 快速指南
- 敏捷数据科学 - 资源
- 敏捷数据科学 - 讨论
敏捷数据科学 - 数据科学流程
本章我们将了解数据科学流程以及理解该流程所需的术语。
“数据科学是数据接口、算法开发和技术相结合,以解决复杂的分析问题”。

数据科学是一个跨学科领域,包含科学方法、流程和系统,其中包括机器学习、数学和统计知识以及传统研究。它还包括黑客技能与专业知识的结合。数据科学汲取了数学、统计学、信息科学和计算机科学、数据挖掘和预测分析的原理。
构成数据科学团队的不同角色如下:
客户
客户是使用产品的人。他们的兴趣决定了项目的成功,他们的反馈在数据科学中非常宝贵。
业务发展
这个数据科学团队会招募早期客户,无论是直接招募还是通过创建登陆页面和促销活动。业务发展团队交付产品的价值。
Learn Data Science in-depth with real-world projects through our Data Science certification course. Enroll and become a certified expert to boost your career.
产品经理
产品经理重视创造最佳产品,这在市场上具有价值。
交互设计师
他们专注于围绕数据模型设计交互,以便用户找到适当的价值。
数据科学家
数据科学家以新的方式探索和转换数据,以创建和发布新功能。这些科学家还结合来自不同来源的数据来创造新的价值。他们在与研究人员、工程师和网络开发人员创建可视化方面发挥着重要作用。
研究人员
顾名思义,研究人员参与研究活动。他们解决数据科学家无法解决的复杂问题。这些问题涉及对机器学习和统计模块的集中关注和时间。
适应变化
数据科学的所有团队成员都需要适应新的变化并根据要求开展工作。为了将敏捷方法与数据科学相结合,应该进行一些更改,如下所示:
选择通才而不是专家。
偏好小型团队而不是大型团队。
使用高级工具和平台。
持续迭代地共享中间工作。
注意
在敏捷数据科学团队中,一个小型通才团队使用可扩展的高级工具,并通过迭代将数据提炼成越来越高的价值状态。
考虑以下与数据科学团队成员工作相关的示例:
设计师交付 CSS。
网络开发人员构建完整的应用程序,了解用户体验和界面设计。
数据科学家应该同时从事研究和构建网络服务(包括网络应用程序)的工作。
研究人员在代码库中工作,该代码库显示解释中间结果的结果。
产品经理试图识别和理解所有相关领域中的缺陷。