非常好的主题涵盖范围,语音和音频质量相对清晰。
课程描述
- 9小时+ 视频内容
- 始终更新的内容
- 掌握大数据生态系统的整体图景
- 通过白板会议体验类似课堂的环境
- 了解关键大数据技术的“是什么”、“为什么”和“架构”,并进行实践练习
- 在 Google Cloud DataProc 伪分布式(单节点)环境中进行实践操作
- 在课程论坛 (forum.datacouch.io) 获取持续的课程支持,确保您成功完成课程
- 由 Bhavuk Chawla 提供,他已为 5000 多名学员进行过线下培训
- 课程完成后获得证书
目标
- 了解各种大数据技术,例如Hadoop、Apache Spark、Apache Nifi、Apache Kafka、Sqoop、Hive、Impala、HBase 等等
- 轻松处理大量数据
- 在 Google Cloud Platform 上使用 DataProc 开发大数据框架虚拟机实例
- 了解大数据的关键架构
- 全面了解大数据生态系统
- 使用各种大数据框架中的文件格式,例如 Avro、JSON、Parquet 等等
- 创建一个实时数据分析管道,用于从 Twitter 获取数据,并使用 Apache Nifi 在 Apache Spark 中执行分析。
先决条件
- SQL 和 RDBMS 基础知识
- Unix/Linux 基本命令,例如 mkdir、ls、cat 等。
- Python/Java(课程中不会广泛使用)
- 用于设置 GCP 帐户的信用卡(如果使用 GCP 试用版,则不会收取任何费用)。您可以完成本课程的所有练习而不会产生费用。有关更多详细信息,请参阅“GCP 帐户最佳实践”部分。
- Twitter 帐户
课程大纲
查看课程内容的详细分解
概述
4 节课
- 关于讲师 02:34 02:34
- 课程结构和方法 03:14 03:14
- 课程先修要求 02:48 02:48
- 课程成果 02:08 02:08
环境设置
4 个讲座
Hadoop 文件系统
4 节课
大数据库数据持久性
10个讲座
使用Hive & Impala进行数据分析
9 节课
通过 Kafka 流式传输事件
6 个讲座
结语
1 节课
讲师 详情
DataCouch
课程 证书
使用您的证书来改变职业或在您目前的职业中提升。