敏捷数据科学 - 数据科学流程



本章我们将了解数据科学流程以及理解该流程所需的术语。

“数据科学是数据接口、算法开发和技术相结合,以解决复杂的分析问题”。

Data Science Process

数据科学是一个跨学科领域,包含科学方法、流程和系统,其中包括机器学习、数学和统计知识以及传统研究。它还包括黑客技能与专业知识的结合。数据科学汲取了数学、统计学、信息科学和计算机科学、数据挖掘和预测分析的原理。

构成数据科学团队的不同角色如下:

客户

客户是使用产品的人。他们的兴趣决定了项目的成功,他们的反馈在数据科学中非常宝贵。

业务发展

这个数据科学团队会招募早期客户,无论是直接招募还是通过创建登陆页面和促销活动。业务发展团队交付产品的价值。

Learn Data Science in-depth with real-world projects through our Data Science certification course. Enroll and become a certified expert to boost your career.

产品经理

产品经理重视创造最佳产品,这在市场上具有价值。

交互设计师

他们专注于围绕数据模型设计交互,以便用户找到适当的价值。

数据科学家

数据科学家以新的方式探索和转换数据,以创建和发布新功能。这些科学家还结合来自不同来源的数据来创造新的价值。他们在与研究人员、工程师和网络开发人员创建可视化方面发挥着重要作用。

研究人员

顾名思义,研究人员参与研究活动。他们解决数据科学家无法解决的复杂问题。这些问题涉及对机器学习和统计模块的集中关注和时间。

适应变化

数据科学的所有团队成员都需要适应新的变化并根据要求开展工作。为了将敏捷方法与数据科学相结合,应该进行一些更改,如下所示:

  • 选择通才而不是专家。

  • 偏好小型团队而不是大型团队。

  • 使用高级工具和平台。

  • 持续迭代地共享中间工作。

注意

在敏捷数据科学团队中,一个小型通才团队使用可扩展的高级工具,并通过迭代将数据提炼成越来越高的价值状态。

考虑以下与数据科学团队成员工作相关的示例:

  • 设计师交付 CSS。

  • 网络开发人员构建完整的应用程序,了解用户体验和界面设计。

  • 数据科学家应该同时从事研究和构建网络服务(包括网络应用程序)的工作。

  • 研究人员在代码库中工作,该代码库显示解释中间结果的结果。

  • 产品经理试图识别和理解所有相关领域中的缺陷。

广告