从S3中导入数据到Dynamodb

时间：2014-12-19 19:07:01 阅读：257 评论：0 收藏：0 [点我收藏+]

本节假设你已经从Dynamodb中导出过数据，并且导出的文件以及被存入S3。文件内部结构会在Verify Data Export File 中描述。

我们称之前导出数据的原始表为source table，数据将要被导入的表为destination table。你可以将S3中的导出文件导入到dynamodb的表中，但是要先确保满足下面条件：

The destination table 已经存在。 (导入任务不会为你创建表)
The destination table 与 source table 有相同的名称。
The destination table 与 source table 有相同的结构。

Destination table不一定要是空的。然而，导入进程会替换掉表中有相同主键的数据。例如，你有一个Customer 表，它的主键是CustomerId，并且只有三个items (CustomerId 1, 2, and 3)。如果要导入的文件中同样包含CustomerID 为1, 2, and 3的items，这些在destination table中的items将会被导入文件中的数据替换。如果文件中还包含CustomerId为4的item，那么这个item会被加入到destination table中。

Destination table 可以在不同的AWS region。例如，假设你有个一个 Customer table在US West (Oregon) region，然后将它的数据导出到了Amazon S3中。你可以将它导入到在 EU (Ireland) region中有相同表明，相同主键的表中。这种做法被称为 cross-region 导出和导入。

注意到AWS管理控制台允许你一次导出多个表的数据。但是，不同的是，你一次只能导入一个表。

从S3导入数据到DynamoDB

登陆AWS管理控制台，然后打开dynamodb控制台： https://console.aws.amazon.com/dynamodb/.
(可选) 如果你想做块区域导入，点击右上角的Select a Region 然后选择要导入的表的区域。控制台会显示该区域下的所有表。如果destination table不存在的话，你需要先创建它。
在 Amazon DynamoDB Tables 页面, 点击 Export/Import.
在 Export/Import 页面，选择一个你要导入的表，然后点击 Import into DynamoDB.
在 Create Import Table Data Pipeline 页面，按下面步骤操作：
1. S3 Input Folder 文本框中输入导入文件对应的 Amazon S3 URI。例如: s3://mybucket/exports这个URI的规则应该是这样 s3://bucketname/folder :
2. - bucketname 是S3中bucket的名称
  - folder 表示存放要导入的文件的名称
3. 导入任务会通过指定的S3位置找到对应的文件。文件内部结构会在Verify Data Export File 中描述。
4. 在 S3 Log Folder 文本框中输入一个S3 URI，导出过程的日志将被存储在相应的folder中。例如：s3://mybucket/logs/
  S3 Log Folder URI的格式和 S3 Output Folder的格式相同。
5. 在 Throughput Rate 文本框中可选择一个百分比。这个比率表示在导出过程中会消耗读吞吐量的上限。例如，假设你要导出的表的读吞吐量是20，同时你设置的百分比是40%。那么导出时所消耗的吞吐量将不会超过8.
  如果你在导出多个表，这个 Throughput Rate 将会被应用到每个表中。
6. Execution Timeout 文本框，输入导出任务的超时时长。如果导出任务在这个时长内还没执行完成，此任务会失败。
7. Send notifications to 文本框，输入一个email地址。在 pipeline被创建后，你将会收到一封email邀请订阅Amazon SNS；如果你接受了此邀请，在每次执行导出操作时你都将会收到email通知。
8. Data Pipeline Role, 选择 DataPipelineDefaultRole.
9. Resource Role, 选择 DataPipelineDefaultResourceRole
确认好以上设置然后点击 Create Export Pipeline.

你的 pipeline 现在将被创建；这个过程可能会花费几分钟完成。要查看当前状态，移步 Managing Export and Import Pipelines.

导入任务会在你的pipeline创建好后立即执行。

从S3中导入数据到Dynamodb

标签：aws dynamodb s3 import

原文地址：http://blog.csdn.net/sweetvvck/article/details/42030729

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行