解释得很好
PySpark 和 AWS:使用 PySpark 和 AWS 掌握大数据
掌握 Spark、Pyspark、AWS、Spark 应用程序、Spark 生态系统、Hadoop 和 PySpark 精通
讲座 -149
时长 -16 小时
终身访问
课程描述
Python 和 Apache Spark 是大数据分析领域当前的热门词汇。借助 PySpark,Python 和 Apache Spark 可以协同工作。您将从本课程的基础知识开始,逐步深入到更复杂的数据分析层面。您将学习如何使用 PySpark 执行端到端的流程,从数据清洗到特征创建和机器学习模型的实现。
在整个课程中,您将使用 PySpark 进行数据分析。您将研究 Spark RDD、Dataframes 以及少量的 Spark SQL。您还将研究可以使用 Spark RDD 和数据帧进行的数据转换和操作。此外,您还将研究 Spark 和 Hadoop 的生态系统以及底层架构。为了运行 Spark 脚本,您将使用 Databricks 环境,您也将有机会对此进行研究。
最终,AWS 云将让您体验 Spark。您将了解如何将 AWS 用于计算、数据库和存储,以及 Spark 如何与各种 AWS 服务交互以获取其所需的数据。
课程概述
本课程中的每个理论解释之后都紧跟着一个实践应用。
本课程旨在反映雇主最看重的能力。您将学习与 PySpark 相关的所有基础理论和实践。
本课程是
- 易于理解的。
- 表达清晰的。
- 全面深入的。
- 包含实时编码的实践操作的。
- 涵盖该领域的最新技术和前沿知识的。
本课程对所有基础知识的全面综合将鼓励您快速进步,并获得超出您所学内容的经验。您将获得作业、任务、活动、测验和解答,并在每个课程结束时提供。基于您之前获得的概念和技术,这是为了评估和促进您的学习。由于目标是让您开始进行实施,因此大多数练习都将涉及代码。
本课程的一些优势包括高质量的视频内容、全面的课程材料、评估问题、完整的课程笔记和教育讲义。如果您对课程有任何疑问,请随时联系我们乐于助人的工作人员。我们承诺及时回复。
课程大纲包括 140 多个短视频。除了了解 PySpark 和 AWS 的原理和方法论外,您还将获得许多有用的实施技能。高清视频的运行时间约为 16 小时。
为什么要学习 PySpark 和 AWS?
PySpark 是实现这一魔法的 Python 库。
由于对 Spark 专业人员的需求量很大,而且薪酬很高,因此学习 PySpark 非常值得。与其他大数据解决方案相比,PySpark 正在以惊人的速度用于处理大数据。
AWS 是增长最快的公共云,于 2006 年推出。现在是利用您对云计算知识,特别是 Amazon 的知识的时候了。
完成本课程后,您将能够将Spark和AWS的概念和实践应用于现实世界的问题。您将能够从零开始实施任何需要PySpark知识的项目。您还将了解PySpark和AWS的理论和实践方面。
课程对象
- PySpark和AWS的初学者以及完全不懂的人。
- 想要开发智能解决方案的人。
- 想要学习PySpark和AWS的人。
- 喜欢在使用Python实施之前先学习理论概念的人。
- 想要学习PySpark及其在实际项目中的应用的人。
- 大数据科学家。
- 大数据工程师。
目标
- 介绍大数据及其重要性。
- PySpark的实践讲解和现场编码。
- Spark应用
- Spark生态系统
- Spark架构
- Hadoop生态系统
- Hadoop架构
- PySpark RDD
- PySpark RDD转换
- PySpark RDD操作
- PySpark DataFrame
- PySpark DataFrame转换
- PySpark DataFrame操作
- PySpark中的协同过滤
- Spark流处理
- ETL管道
- CDC和持续复制
先决条件
- 具备Python编程基础。
- 对编程有基本的了解。
- 有学习和实践的意愿。
课程大纲
查看课程内容的详细分解
简介
5 节课
-
为什么选择大数据 03:11 03:11
-
PySpark的应用 03:12 03:12
-
教师介绍 00:46 00:46
-
课程介绍 01:49 01:49
-
项目概述 03:25 03:25
Hadoop、Spark 生态系统和架构简介
11 个讲座
Spark DF
40 节课
Spark Streaming
9 节课
项目 - 更改数据捕获/复制正在进行
25 节课
讲师 详情
Packt 出版社
课程 证书
使用您的证书来改变职业或在您目前的职业中提升。
我们的学生工作
与 最佳
反馈
非常有帮助。
相关 视频课程
查看更多
