DynamoDB - 数据管道



数据管道允许将数据导出和导入到表、文件或 S3 存储桶中。这当然在备份、测试和类似的需求或场景中非常有用。

在导出操作中,您使用数据管道控制台,它创建一个新的管道并启动一个 Amazon EMR(弹性 MapReduce)集群来执行导出。EMR 从 DynamoDB 读取数据并写入目标。我们将在本教程的后面详细讨论 EMR。

在导入操作中,您使用数据管道控制台,它创建一个管道并启动 EMR 来执行导入。它从源读取数据并写入目标。

注意 - 由于使用了特定的服务(特别是 EMR 和 S3),导出/导入操作会产生费用。

使用数据管道

使用数据管道时,必须指定操作和资源权限。您可以利用 IAM 角色或策略来定义它们。执行导入/导出的用户应注意,他们需要一个活动的访问密钥 ID 和密钥。

数据管道的 IAM 角色

使用数据管道需要两个 IAM 角色 -

  • DataPipelineDefaultRole - 它包含您允许管道为您执行的所有操作。

  • DataPipelineDefaultResourceRole - 它包含您允许管道为您配置的资源。

如果您是数据管道的新用户,则必须生成每个角色。所有以前的用户都拥有这些角色,因为它们是现有的角色。

使用 IAM 控制台为数据管道创建 IAM 角色,并执行以下四个步骤 -

步骤 1 - 登录到位于 https://console.aws.amazon.com/iam/ 的 IAM 控制台

步骤 2 - 从仪表板中选择角色

步骤 3 - 选择创建新角色。然后在角色名称字段中输入 DataPipelineDefaultRole,并选择下一步。在角色类型面板中的AWS 服务角色列表中,导航到数据管道,然后选择选择。在审查面板中选择创建角色

步骤 4 - 选择创建新角色

广告