什么是 AWS Redshift:优势、成本和设置?


我们生活在一个信息过剩的时代。欢迎来到数据时代,我们每天生成 25 亿亿字节(也称为艾字节)的信息。

介绍一下今天的说法:“这是一个巨大的信息量!”

当今企业利用这些信息做出关键决策。

数据驱动的决策是明智的决策,更有可能取得成功。

什么是 AWS Redshift?

AWS Redshift 是一种知名的数据仓库解决方案,能够处理艾字节级的数据。

您可能正在考虑支持各种用例,例如处理实时分析、合并不同数据源、日志分析等等。

Redshift 得益于其大规模并行处理 (MPP) 技术,能够以闪电般的速度对海量数据执行操作——同时,其成本通常仅为 Prophet 和 Teradata 等竞争对手提供类似产品的成本的一小部分。

每个 Amazon Redshift 数据仓库都包含一组节点,这些节点被组织成一个集群。

每个集群都运行其 Redshift 引擎并至少保存一个数据库。

虽然 Redshift 是一个分析数据库,但它足够灵活,可以允许云用户运行传统的关联数据库。

此外,它是一个列存储数据库,以列式格式存储数据,这在读取和写入数据时可以提高性能。

Redshift 是一种完全托管的数据仓库,允许用户从几 GB 的数据开始,最终扩展到 PB 级数据。

它也被称为 OLAP 样式(联机分析处理)数据库。

AWS Redshift 优势

  • AWS 集成 − AWS 是三大最流行且最常使用的云解决方案之一(另外两个是 Azure 和 Google Cloud),而 Redshift 与 Amazon Web Services 完美配合。

  • 数据加密和安全性 − Amazon 为其客户提供多层安全性,包括访问控制、虚拟专用云和主动数据加密;客户可以决定需要加密的内容。

  • 速度 − Redshift 由于 MPP 技术而提供无与伦比的速度。

  • 轻松部署 − 您可以在几分钟内以传统数据仓库一小部分的成本部署 Redshift 集群。

  • 标准、可靠的备份 − Amazon 定期进行可预测的备份,可用于恢复和数据恢复操作。此外,Amazon 将这些数据存储在多个区域中。

  • 您可以使用熟悉的工具 − Redshift 使用 PostgreSQL,因此所有 SQL 查询都可以在其中使用。此外,您可以选择您通常使用的任何 ETL(提取、转换、加载)、SQL 和商业智能 (BI) 工具。

  • 乏味任务自动化 − 没有什么比一遍又一遍地执行相同的乏味小任务(无论每天、每周、每月还是无论如何)更令人沮丧和耗时的了。Redshift 允许您自动化这些烦人的重复任务,从而让您的员工可以处理更具挑战性的职责。

AWS Redshift 成本

成本低至每 TB 数据每小时 0.25 美元,您可以从此基础上扩展。持续评估的数据来自 Amazon 的 Redshift 定价页面。

Amazon 还提供按需付费定价结构,该结构会根据您的需求进行调整。

总结。使用 Amazon Redshift,您可以从每小时 $0.25 开始,扩展到 PB 级数据和数百个并发用户。选择适合您业务需求的配置,并能够在不过度配置计算或存储的情况下扩展容量。

如何设置 Amazon Redshift?

设置 Amazon Redshift 很简单

  • 获取 AWS 账户:如果您还没有 Amazon Web Services 账户,请创建一个。

  • 打开防火墙端口:Redshift 需要打开一个端口,它通常默认为端口 5439,因此请确保您的防火墙中该端口可用。或者,您可以在创建集群时在防火墙中指定另一个开放端口;但是请注意:创建集群后,您无法更改端口号。

  • 授予访问其他 AWS 资源的权限:您需要允许 Redshift 访问其他 AWS 资源。要么创建一个与 Redshift 集群关联的专用 IAM 角色,要么向具有所需权限的 IAM 用户提供 AWS 访问密钥。

  • 启动 Redshift 集群:以具有所需权限的用户身份登录并打开 Amazon Redshift 控制台。

  • 选择区域:选择您希望在其中创建第一个集群的区域。

  • 输入值:选择快速启动集群并填写以下值 -

    节点类型:dc2.large。

    处理节点数:2。

    集群标识符:examplecluster。

    主用户名称:awsuser。

    主用户密码和确认密码:为主用户账户输入一个密码

    数据库端口:5439。

    可访问的 IAM 角色:选择 myRedshiftRole。

  • 等待:点击启动集群,然后等待启动完成。完成后,单击关闭返回集群列表。

  • 选择集群:单击列表上方的集群按钮,然后单击修改。选择您希望与集群关联的 VPC 安全组,然后单击修改以保存您的选择。

  • 授权访问:您需要配置一个安全组以授权访问。如果集群来自 EC2-VPC 平台,请按照以下步骤操作。

从这里开始,您可以执行诸如运行查询之类的任务。同样,请咨询 AWS 网站以获取更详细的说明。

结论

许多用户选择 Amazon Redshift 来加快其上市时间,因为它易于使用,能够在任何规模上提供性能,并允许您探索所有数据。您可以为可预测的工作负载选择预配置选项,或者选择 Amazon Redshift Serverless 选项以自动配置和扩展数据仓库的容量,从而为要求苛刻和不可预测的工作负载提供高性能。

更新于: 2022-11-16

172 次浏览

启动您的 职业生涯

通过完成课程获得认证

开始
广告