Amazon Glacier - amipee210’s blog

Amazon Glacierとは

低頻度アクセスかつ長期保存を想定したストレージサービス

セキュアかつ堅牢性の高い超低価格ストレージサービス
テープ媒体などで保管するような大容量データを、安価で確実に長期保存する
データの取り出し回数は少ないが、必要時に確実にデータの取り出しが行える

Amazon Glacierの特徴

特徴は、「低コスト」「高い耐久性」「柔軟性」「セキュア」「シンプル」。

低コスト

初期投資不要
運用費不要
従量課金（格納・取り出し・転送）

高い耐久性

耐久性 99.999999999%（＝S3と同様）
同一リージョン内で複数拠点への自動複製保存（＝S3と同様）
データのインテグリティ(整合性)チェックおよび自動復旧

柔軟性

格納容量無制限
保存期間制限なし
いつでもデータの取り出し可能
保守切れ等によるデータ移行作業不要
AWS INPORT/EXPORTにも対応

セキュア

やりとりはすべてSSL通信
同一リージョン内のみでデータ保管
自動サーバサイド暗号化（AES256）
IAMとの連携によるアクセス管理

シンプル

APIによる制御
キャパシティプランニング不要
ハードウェア、ソフトウェアからの解放
3rd Party製品もサポート

重要用語集

Vault (ボルト)
アーカイブ格納用コンテナ = 箱
・格納アーカイブ数の制限なし
・ IAMによるアクセス制限指定可能
・ Vault毎にデフォルトのSNS通知設定可能
Vault情報は「Management Console」または「API」で取得可能

Archive (アーカイブ)
格納データファイル (ファイル, ZIP, TAR等)
・アップロード時にシステム側でArchive IDを自動発行
・格納データの更新不可
・マルチパートアップロードに対応
　 → ファイルを分割し、並列でアップロード処理を実施することで、アップロード時間の短縮が可能。100MB以上の場合は、マルチパートアップロード利用推奨

Inventory (インベントリ)
Vault内に格納されたアーカイブ一覧情報
・ JSONもしくはCSV形式でダウンロード可能
・ Retrieve Job経由でダウンロード可能
・情報は1日1回バッチにより自動更新

Retrieve Job
アーカイブおよびインベントリ取り出し要求ジョブ
・非同期によるデータ取得
・ Retrieve Job実施後、ダウンロード準備完了まで3～5時間

Download
Retrieveされたアーカイブもしくはインベントリのダウンロード処理
・ Retrieve Job完了後、24時間はダウンロード可能

その他機能

AWS SDK

　　・ High Level API
　　　ファイルサイズを自動的に確認し、必要であればマルチアップロードを実施

　　・ Low Level API
　　　パラメータの個別設定が可能 (AccountID/マルチアップロードサイズ等)

Retrieve Jobの実行

　　＜アーカイブの取得要求＞

　　・アーカイブIDを指定してRetrieve Jobを実行
　　・ JobParameterのTypeに"archive-retrieval"を指定
　　・ SNS ARNを個別に指定可能
　　・戻り値より、JobIDを取得

　　＜Inventoryの取得要求＞

　　・ Vault名もしくはアーカイブIDを指定してRetrieve Jobを実行
　　・ JobParameterのTypeに"inventory-retrieval"を指定
　　・ Formatを"CSV"もしくは"JSON"を指定(デフォルトはJSON)
　　・ SNS ARNを個別に指定可能
　　・戻り値より、JobIDを取得

　　＜Job実行状態確認＞

　　・ Retrieve Jobの実行状態(InProgress/Succeeded/Failed)を取得可能
　　・ Vault名とJob IDを指定して実行

Amazon S3とGlacierの違い

f:id:amipee210:20150904192431g:plain