
- 敏捷数据科学教程
- 敏捷数据科学 - 主页
- 敏捷数据科学 - 介绍
- 方法论概念
- 敏捷数据科学 - 流程
- 敏捷工具和安装
- 敏捷中的数据处理
- SQL 与 NoSQL
- NoSQL 和数据流编程
- 收集和显示记录
- 数据可视化
- 数据丰富
- 处理报告
- 预测的作用
- 使用 PySpark 提取特征
- 构建回归模型
- 部署预测系统
- 敏捷数据科学 - SparkML
- 修复预测问题
- 提高预测性能
- 使用敏捷和数据科学创造更好的场景
- 敏捷的实现
- 敏捷数据科学有用资源
- 敏捷数据科学 - 快速指南
- 敏捷数据科学 - 资源
- 敏捷数据科学 - 讨论
敏捷数据科学 - 处理报告
在本章中,我们将了解报告创建,这是敏捷方法的一个重要模块。敏捷 sprints 将可视化创建的图表页面制作为完整的报告。借助报告,图表变得具有交互性,静态页面变得动态并且网络相关数据。下面展示了数据价值金字塔报告阶段的特性 -

我们将更多地关注创建 csv 文件,该文件可用作数据科学分析的报告,并且得出了结论。尽管敏捷专注于减少文档记录,但生成报告始终被认为是为了提及产品开发的进度。
import csv #---------------------------------------------------------------------- def csv_writer(data, path): """ Write data to a CSV file path """ with open(path, "wb") as csv_file: writer = csv.writer(csv_file, delimiter=',') for line in data: writer.writerow(line) #---------------------------------------------------------------------- if __name__ == "__main__": data = ["first_name,last_name,city".split(","), "Tyrese,Hirthe,Strackeport".split(","), "Jules,Dicki,Lake Nickolasville".split(","), "Dedric,Medhurst,Stiedemannberg".split(",") ] path = "output.csv" csv_writer(data, path)
以上代码将帮助你生成“csv 文件”,如下所示 -

让我们考虑 csv(逗号分隔值)报告的以下优点 -
- 它对人友好,并且易于手动编辑。
- 它易于实现和解析。
- CSV 可以用于处理所有应用程序。
- 它较小并处理起来更快。
- CSV 遵循标准格式。
- 它为数据科学提供了直接的模式。
广告