AWS Data PipelineでDynamoDBのインポート/エクスポート

2019年7月6日

AWS Data Pipelineは、AWSのサービス間やオンプレ環境とのデータ転送を支援するサービスです。

複数のサービスを組み合わせることでETLツールのように使うこともできます。

今回はこれを使用してDynamoDBからデータのインポート/エクスポートを行ってみます。

1. DynamoDBのエクスポート
2. DynamoDBへインポート
- 2.1. インポート用パイプラインを定義する
- 2.2. インポート用パイプラインを実行する
3. 後日談

DynamoDBのエクスポート

まずは、DynamoDBのエクスポートから。

docs.aws.amazon.com

テーブルの作成とサンプルデータのロード - Amazon DynamoDB

https://docs.aws.amazon.com/ja_jp/amazondynamodb/latest/developerguide/SampleData.html

Amazon DynamoDB 内にテーブルを作成し、サンプルデータをロードします。

公式マニュアルにあるサンプルテーブル「ProductCatalog」を作ってこれをエクスポートしてみます。

エクスポート先のS3フォルダを作成

事前準備としてエクスポート先に指定するS3バケットとフォルダを作っておきます。
Data Pipelineのログもここに出力するので合わせて作っておきます。

バケット・フォルダには特段設定は必要ありません。

エクスポート用パイプラインを定義する

それでは、エクスポート用のパイプラインを定義していきます。

名前を適当に付けて、テンプレートは「Export DynamoDB table to S3」を選びます。
テーブルと出力先のS3フォルダを選びます。

スケジュールは手動起動にし、ログの出力先のS3フォルダを設定。
IAMロールはデフォルトを設定します。デフォルトのロールがなければ自動で作成されます。

「Edit in Architect」を押すとさらに細かい設定画面に移り、「Activate」を押すと、パイプラインがアクティブになります。

エクスポート用パイプラインを実行する

先の画面で「Activate」していれば、特にエラーがなければ実行されます。

パイプラインを起動すると自動でAmazon EMRクラスタが作成され、EMRが使うためのEC2インスタンスも作成されます。
細かい進捗状態やエラーはEMRクラスタを見に行った方が分かりやすいです。

ステータスが「FINISHED」になれば完了です。

docs.aws.amazon.com

パイプラインのステータスの詳細を解釈する - AWS Data Pipeline

https://docs.aws.amazon.com/ja_jp/datapipeline/latest/DeveloperGuide/dp-pipeline-status.html

AWS Data Pipeline コンソールおよびコマンドラインインターフェイスで、パイプラインのステータス値と定義を表示できます。

大体８分かかりました。
起動したEMRクラスタやEC2インスタンスは自動で破棄されます。
何らかの原因でパイプラインの処理が終わらない場合は、パイプラインを手動で止めないと動き続けてしまうため注意が必要です。

指定したS3フォルダにバックアップファイルができました。
中身はJSONです。

{"Brand":{"s":"Brand-Company C"},"Description":{"s":"205 Description"},"Price":{"n":"500"},"Color":{"l":[{"s":"Red"},{"s":"Black"}]},"ProductCategory":{"s":"Bicycle"},"Title":{"s":"18-Bike-204"},"Id":{"n":"205"},"BicycleType":{"s":"Hybrid"}}
{"Brand":{"s":"Brand-Company B"},"Description":{"s":"203 Description"},"Price":{"n":"300"},"Color":{"l":[{"s":"Red"},{"s":"Green"},{"s":"Black"}]},"ProductCategory":{"s":"Bicycle"},"Title":{"s":"19-Bike-203"},"Id":{"n":"203"},"BicycleType":{"s":"Road"}}
{"Brand":{"s":"Brand-Company A"},"Description":{"s":"202 Description"},"Price":{"n":"200"},"Color":{"l":[{"s":"Green"},{"s":"Black"}]},"ProductCategory":{"s":"Bicycle"},"Title":{"s":"21-Bike-202"},"Id":{"n":"202"},"BicycleType":{"s":"Road"}}
{"Brand":{"s":"Mountain A"},"Description":{"s":"201 Description"},"Price":{"n":"100"},"Color":{"l":[{"s":"Red"},{"s":"Black"}]},"ProductCategory":{"s":"Bicycle"},"Title":{"s":"18-Bike-201"},"Id":{"n":"201"},"BicycleType":{"s":"Road"}}
{"Brand":{"s":"Brand-Company B"},"Description":{"s":"204 Description"},"Price":{"n":"400"},"Color":{"l":[{"s":"Red"}]},"ProductCategory":{"s":"Bicycle"},"Title":{"s":"18-Bike-204"},"Id":{"n":"204"},"BicycleType":{"s":"Mountain"}}
{"InPublication":{"bOOL":true},"PageCount":{"n":"600"},"ISBN":{"s":"222-2222222222"},"Price":{"n":"20"},"Authors":{"l":[{"s":"Author1"},{"s":"Author2"}]},"ProductCategory":{"s":"Book"},"Title":{"s":"Book 102 Title"},"Dimensions":{"s":"8.5 x 11.0 x 0.8"},"Id":{"n":"102"}}
{"InPublication":{"bOOL":false},"PageCount":{"n":"600"},"ISBN":{"s":"333-3333333333"},"Price":{"n":"2000"},"Authors":{"l":[{"s":"Author1"},{"s":"Author2"}]},"ProductCategory":{"s":"Book"},"Title":{"s":"Book 103 Title"},"Dimensions":{"s":"8.5 x 11.0 x 1.5"},"Id":{"n":"103"}}
{"InPublication":{"bOOL":true},"PageCount":{"n":"500"},"ISBN":{"s":"111-1111111111"},"Price":{"n":"2"},"Authors":{"l":[{"s":"Author1"}]},"ProductCategory":{"s":"Book"},"Title":{"s":"Book 101 Title"},"Dimensions":{"s":"8.5 x 11.0 x 0.5"},"Id":{"n":"101"}}