Amazon Glacier
Amazon Glacierとは
低頻度アクセスかつ長期保存を想定したストレージサービス
- セキュアかつ堅牢性の高い超低価格ストレージサービス
- テープ媒体などで保管するような大容量データを、安価で確実に長期保存する
- データの取り出し回数は少ないが、必要時に確実にデータの取り出しが行える
Amazon Glacierの特徴
特徴は、「低コスト」「高い耐久性」「柔軟性」「セキュア」「シンプル」。
低コスト
- 初期投資不要
- 運用費不要
- 従量課金(格納・取り出し・転送)
高い耐久性
- 耐久性 99.999999999%(=S3と同様)
- 同一リージョン内で複数拠点への自動複製保存(=S3と同様)
- データのインテグリティ(整合性)チェックおよび自動復旧
柔軟性
- 格納容量無制限
- 保存期間制限なし
- いつでもデータの取り出し可能
- 保守切れ等によるデータ移行作業不要
- AWS INPORT/EXPORTにも対応
セキュア
- やりとりはすべてSSL通信
- 同一リージョン内のみでデータ保管
- 自動サーバサイド暗号化(AES256)
- IAMとの連携によるアクセス管理
シンプル
- APIによる制御
- キャパシティプランニング不要
- ハードウェア、ソフトウェアからの解放
- 3rd Party製品もサポート
重要用語集
- Vault (ボルト)
アーカイブ格納用コンテナ = 箱
・ 格納アーカイブ数の制限なし
・ IAMによるアクセス制限指定可能
・ Vault毎にデフォルトのSNS通知設定可能
Vault情報は「Management Console」または「API」で取得可能
- Archive (アーカイブ)
格納データファイル (ファイル, ZIP, TAR等)
・ アップロード時にシステム側でArchive IDを自動発行
・ 格納データの更新不可
・ マルチパートアップロードに対応
→ ファイルを分割し、並列でアップロード処理を実施することで、アップロード時間の短縮が可能。100MB以上の場合は、マルチパートアップロード利用推奨
- Inventory (インベントリ)
Vault内に格納されたアーカイブ一覧情報
・ JSONもしくはCSV形式でダウンロード可能
・ Retrieve Job経由でダウンロード可能
・ 情報は1日1回バッチにより自動更新
- Retrieve Job
アーカイブおよびインベントリ取り出し要求ジョブ
・ 非同期によるデータ取得
・ Retrieve Job実施後、ダウンロード準備完了まで3~5時間
- Download
Retrieveされたアーカイブもしくはインベントリのダウンロード処理
・ Retrieve Job完了後、24時間はダウンロード可能
その他機能
・ High Level API
ファイルサイズを自動的に確認し、必要であればマルチアップロードを実施
・ Low Level API
パラメータの個別設定が可能 (AccountID/マルチアップロードサイズ等)
- Retrieve Jobの実行
<アーカイブの取得要求>
・ アーカイブIDを指定してRetrieve Jobを実行
・ JobParameterのTypeに"archive-retrieval"を指定
・ SNS ARNを個別に指定可能
・ 戻り値より、JobIDを取得
<Inventoryの取得要求>
・ Vault名もしくはアーカイブIDを指定してRetrieve Jobを実行
・ JobParameterのTypeに"inventory-retrieval"を指定
・ Formatを"CSV"もしくは"JSON"を指定(デフォルトはJSON)
・ SNS ARNを個別に指定可能
・ 戻り値より、JobIDを取得
<Job実行状態確認>
・ Retrieve Jobの実行状態(InProgress/Succeeded/Failed)を取得可能
・ Vault名とJob IDを指定して実行
Amazon S3とGlacierの違い