Amazon Glacier

Amazon Glacierとは

低頻度アクセスかつ長期保存を想定したストレージサービス

  • セキュアかつ堅牢性の高い超低価格ストレージサービス
  • テープ媒体などで保管するような大容量データを、安価で確実に長期保存する
  • データの取り出し回数は少ないが、必要時に確実にデータの取り出しが行える

Amazon Glacierの特徴

特徴は、「低コスト」「高い耐久性」「柔軟性」「セキュア」「シンプル」。

低コスト

  1. 初期投資不要
  2. 運用費不要
  3. 従量課金(格納・取り出し・転送)

高い耐久性

  1. 耐久性 99.999999999%(=S3と同様)
  2. 同一リージョン内で複数拠点への自動複製保存(=S3と同様)
  3. データのインテグリティ(整合性)チェックおよび自動復旧

柔軟性

  1. 格納容量無制限
  2. 保存期間制限なし
  3. いつでもデータの取り出し可能
  4. 保守切れ等によるデータ移行作業不要
  5. AWS INPORT/EXPORTにも対応

セキュア

  1. やりとりはすべてSSL通信
  2. 同一リージョン内のみでデータ保管
  3. 自動サーバサイド暗号化(AES256)
  4. IAMとの連携によるアクセス管理

シンプル

  1. APIによる制御
  2. キャパシティプランニング不要
  3. ハードウェア、ソフトウェアからの解放
  4. 3rd Party製品もサポート

重要用語集

  • Vault (ボルト)
    アーカイブ格納用コンテナ = 箱
    ・ 格納アーカイブ数の制限なし
    IAMによるアクセス制限指定可能
    ・ Vault毎にデフォルトのSNS通知設定可能
    Vault情報は「Management Console」または「API」で取得可能

 

  • Archive (アーカイブ)
    格納データファイル (ファイル, ZIP, TAR等)
    ・ アップロード時にシステム側でArchive IDを自動発行
    ・ 格納データの更新不可
    マルチパートアップロードに対応
      → ファイルを分割し、並列でアップロード処理を実施することで、アップロード時間の短縮が可能。100MB以上の場合は、マルチパートアップロード利用推奨

 

  • Inventory (インベントリ)
    Vault内に格納されたアーカイブ一覧情報
    JSONもしくはCSV形式でダウンロード可能
    ・ Retrieve Job経由でダウンロード可能
    ・ 情報は1日1回バッチにより自動更新

 

  • Retrieve Job
    アーカイブおよびインベントリ取り出し要求ジョブ
    ・ 非同期によるデータ取得
    ・ Retrieve Job実施後、ダウンロード準備完了まで3~5時間

 

  • Download
    Retrieveされたアーカイブもしくはインベントリのダウンロード処理
    ・ Retrieve Job完了後、24時間はダウンロード可能

 

その他機能

  ・ High Level API
    ファイルサイズを自動的に確認し、必要であればマルチアップロードを実施

  ・ Low Level API
    パラメータの個別設定が可能 (AccountID/マルチアップロードサイズ等)

  • Retrieve Jobの実行

  <アーカイブの取得要求>

  ・ アーカイブIDを指定してRetrieve Jobを実行
  ・ JobParameterのTypeに"archive-retrieval"を指定
  ・ SNS ARNを個別に指定可能
  ・ 戻り値より、JobIDを取得

 

  <Inventoryの取得要求>

  ・ Vault名もしくはアーカイブIDを指定してRetrieve Jobを実行
  ・ JobParameterのTypeに"inventory-retrieval"を指定
  ・ Formatを"CSV"もしくは"JSON"を指定(デフォルトはJSON)
  ・ SNS ARNを個別に指定可能
  ・ 戻り値より、JobIDを取得

  <Job実行状態確認>

  ・ Retrieve Jobの実行状態(InProgress/Succeeded/Failed)を取得可能
  ・ Vault名Job IDを指定して実行

Amazon S3とGlacierの違い

f:id:amipee210:20150904192431g:plain