Tutorialspoint

黑色星期五,享受历史最低价! 使用优惠码:BFS8

PySpark 和 AWS:使用 PySpark 和 AWS 掌握大数据

个人图标 Packt 出版社

4.5

PySpark 和 AWS:使用 PySpark 和 AWS 掌握大数据

掌握 Spark、Pyspark、AWS、Spark 应用程序、Spark 生态系统、Hadoop 和 PySpark 精通

更新时间图标 更新于 2024 年 9 月

语言图标 语言 - 英语

个人图标 Packt 出版社

英语 [CC]

类别图标 开发,数据科学,大数据

讲座 -149

时长 -16 小时

终身访问

4.5

price-loader

终身访问

30 天退款保证

培训 5 人或以上?

让您的团队随时随地访问 Tutorials Point 上 10000 多门顶级课程。

课程描述

Python 和 Apache Spark 是大数据分析领域当前的热门词汇。借助 PySpark,Python 和 Apache Spark 可以协同工作。您将从本课程的基础知识开始,逐步深入到更复杂的数据分析层面。您将学习如何使用 PySpark 执行端到端的流程,从数据清洗到特征创建和机器学习模型的实现。

在整个课程中,您将使用 PySpark 进行数据分析。您将研究 Spark RDD、Dataframes 以及少量的 Spark SQL。您还将研究可以使用 Spark RDD 和数据帧进行的数据转换和操作。此外,您还将研究 Spark 和 Hadoop 的生态系统以及底层架构。为了运行 Spark 脚本,您将使用 Databricks 环境,您也将有机会对此进行研究。

最终,AWS 云将让您体验 Spark。您将了解如何将 AWS 用于计算、数据库和存储,以及 Spark 如何与各种 AWS 服务交互以获取其所需的数据。

课程概述

本课程中的每个理论解释之后都紧跟着一个实践应用。

本课程旨在反映雇主最看重的能力。您将学习与 PySpark 相关的所有基础理论和实践。

本课程是

  • 易于理解的。
  • 表达清晰的。
  • 全面深入的。
  • 包含实时编码的实践操作的。
  • 涵盖该领域的最新技术和前沿知识的。


本课程对所有基础知识的全面综合将鼓励您快速进步,并获得超出您所学内容的经验。您将获得作业、任务、活动、测验和解答,并在每个课程结束时提供。基于您之前获得的概念和技术,这是为了评估和促进您的学习。由于目标是让您开始进行实施,因此大多数练习都将涉及代码。

本课程的一些优势包括高质量的视频内容、全面的课程材料、评估问题、完整的课程笔记和教育讲义。如果您对课程有任何疑问,请随时联系我们乐于助人的工作人员。我们承诺及时回复。

课程大纲包括 140 多个短视频。除了了解 PySpark 和 AWS 的原理和方法论外,您还将获得许多有用的实施技能。高清视频的运行时间约为 16 小时。

为什么要学习 PySpark 和 AWS?

PySpark 是实现这一魔法的 Python 库。

由于对 Spark 专业人员的需求量很大,而且薪酬很高,因此学习 PySpark 非常值得。与其他大数据解决方案相比,PySpark 正在以惊人的速度用于处理大数据。

AWS 是增长最快的公共云,于 2006 年推出。现在是利用您对云计算知识,特别是 Amazon 的知识的时候了。

完成本课程后,您将能够将Spark和AWS的概念和实践应用于现实世界的问题。您将能够从零开始实施任何需要PySpark知识的项目。您还将了解PySpark和AWS的理论和实践方面。


课程对象

  • PySpark和AWS的初学者以及完全不懂的人。
  • 想要开发智能解决方案的人。
  • 想要学习PySpark和AWS的人。
  • 喜欢在使用Python实施之前先学习理论概念的人。
  • 想要学习PySpark及其在实际项目中的应用的人。
  • 大数据科学家。
  • 大数据工程师。

目标

  • 介绍大数据及其重要性。
  • PySpark的实践讲解和现场编码。
  • Spark应用
  • Spark生态系统
  • Spark架构
  • Hadoop生态系统
  • Hadoop架构
  • PySpark RDD
  • PySpark RDD转换
  • PySpark RDD操作
  • PySpark DataFrame
  • PySpark DataFrame转换
  • PySpark DataFrame操作
  • PySpark中的协同过滤
  • Spark流处理
  • ETL管道
  • CDC和持续复制

先决条件

  • 具备Python编程基础。
  • 对编程有基本的了解。
  • 有学习和实践的意愿。
PySpark and AWS: Master Big Data With PySpark and AWS

课程大纲

查看课程内容的详细分解

简介
5 节课
  • 播放图标 为什么选择大数据 03:11 03:11
  • 播放图标 PySpark的应用 03:12 03:12
  • 播放图标 教师介绍 00:46 00:46
  • 播放图标 课程介绍 01:49 01:49
  • 播放图标 项目概述 03:25 03:25
Hadoop、Spark 生态系统和架构简介
11 个讲座
Tutorialspoint
Tutorialspoint
Spark DF
40 节课
Tutorialspoint
Tutorialspoint
Spark Streaming
9 节课
Tutorialspoint
Tutorialspoint
项目 - 更改数据捕获/复制正在进行
25 节课
Tutorialspoint

讲师 详情

Packt Publishing

Packt 出版社

课程 证书

使用您的证书来改变职业或在您目前的职业中提升。

sample Tutorialspoint certificate

我们的学生工作
最佳

反馈

S

Shirin Satam

解释得很好

A

Ashish Kumar Srivastav

非常有帮助。

相关 视频课程

查看更多

年度会员

成为Tutorials Point的尊贵会员,并享受我们庞大的顶级视频课程库的无限访问权限。

立即订阅
Annual Membership

在线认证

掌握主要的热门技术并成为受人尊敬的认证专业人士。

立即探索
Online Certifications

联系我们

1800-202-0515

© . All rights reserved.