Amazon Web Services - Redshift



Amazon Redshift 是一种完全托管的云数据仓库服务。其数据集范围从数百 GB 到 PB。创建数据仓库的初始过程是启动一组称为节点的计算资源,这些资源被组织成称为集群的组。之后,您可以处理您的查询。

如何设置 Amazon Redshift?

以下是设置 Amazon Redshift 的步骤。

步骤 1 - 使用以下步骤登录并启动 Redshift 集群。

  • 登录 AWS 管理控制台,并使用以下链接打开 Amazon Redshift 控制台:https://console.aws.amazon.com/redshift/

  • 使用屏幕右上角的区域菜单选择要创建集群的区域。

  • 单击“启动集群”按钮。

Launch Cluster
  • 将打开“集群详细信息”页面。提供所需的详细信息,然后一直单击“继续”按钮,直到到达“审查”页面。

Cluster Details
  • 将打开一个确认页面。单击“关闭”按钮以完成操作,以便集群在“集群”列表中可见。

Cluster Close
  • 在列表中选择集群,并查看“集群状态”信息。该页面将显示集群状态。

Cluster Status

步骤 2 - 配置安全组以授权客户端连接到集群。授权访问 Redshift 取决于客户端是否授权 EC2 实例。

请按照以下步骤在 EC2-VPC 平台上配置安全组。

  • 打开 Amazon Redshift 控制台,然后单击导航窗格中的“集群”。

  • 选择所需的集群。将打开其“配置”选项卡。

Snowplow
  • 单击“安全组”。

  • 打开“安全组”页面后,单击“入站”选项卡。

Security Group
  • 单击“编辑”按钮。设置如下所示的字段,然后单击“保存”按钮。

    • 类型 - 自定义 TCP 规则。

    • 协议 - TCP。

    • 端口范围 - 输入启动集群时使用的相同端口号。Amazon Redshift 的默认端口为 5439。

    • - 选择“自定义 IP”,然后输入 0.0.0.0/0。

Edit Inbound Rules

步骤 3 - 连接到 Redshift 集群。

有两种方法可以连接到 Redshift 集群:直接连接或通过 SSL 连接。

以下是直接连接的步骤。

  • 使用 SQL 客户端工具连接集群。它支持与 PostgreSQL JDBC 或 ODBC 驱动程序兼容的 SQL 客户端工具。

    使用以下链接下载:JDBC https://jdbc.postgresql.ac.cn/download/postgresql-8.4-703.jdbc4.jar

    ODBC https://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_08_04_0200.zip 或 http://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_09_00_0101x64.zip 用于 64 位机器

  • 请按照以下步骤获取连接字符串。

    • 打开 Amazon Redshift 控制台,并在导航窗格中选择“集群”。

    • 选择所需的集群,然后单击“配置”选项卡。

    • 将打开一个页面,如下面的屏幕截图所示,其中包含“集群数据库属性”下的 JDBC URL。复制该 URL。

Cluster
  • 请按照以下步骤使用 SQL Workbench/J 连接集群。

    • 打开 SQL Workbench/J。

    • 选择“文件”,然后单击“连接”窗口。

    • 选择“创建新的连接配置文件”,并填写名称等所需详细信息。

    • 单击“管理驱动程序”,将打开“管理驱动程序”对话框。

    • 单击“创建新条目”按钮,并填写所需的详细信息。

Manage Drivers
  • 单击文件夹图标,然后导航到驱动程序位置。最后,单击“打开”按钮。

Redshift
  • 保留“类名”框和“示例 URL”框为空白。单击“确定”。

  • 从列表中选择驱动程序。

  • 在“URL”字段中,粘贴已复制的 JDBC URL。

  • 在各自的字段中输入用户名和密码。

  • 选中“自动提交”框,然后单击“保存配置文件列表”。

Select Connection Profile

Amazon Redshift 的功能

以下是 Amazon Redshift 的功能:

  • 支持 VPC - 用户可以在 VPC 中启动 Redshift,并通过虚拟网络环境控制对集群的访问。

  • 加密 - 存储在 Redshift 中的数据可以在创建 Redshift 中的表时进行加密和配置。

  • SSL - SSL 加密用于加密客户端和 Redshift 之间的连接。

  • 可扩展 - 只需点击几下,即可根据需要轻松扩展 Redshift 数据仓库中的节点数量。它还允许在不影响性能的情况下扩展存储容量。

  • 经济高效 - Amazon Redshift 是传统数据仓库实践的经济高效替代方案。没有前期成本、没有长期承诺和按需定价结构。

广告