Amazon Elastic MapReduce(EMR)の選択肢を考えるきょうから試せる Hadoop“スモールスタート”ガイド(5)(3/6 ページ)

» 2017年02月28日 05時00分 公開

AWSで提供されるインフラ構成

 ここから、EMRについて詳細に取り扱っていきます。そもそもEMRはAWSのインフラ上で動くので、まずはAWSがどのようなインフラを備えているのかを見ていくことにしましょう。

リージョン

 リージョンとはAWSのデータセンターが位置する場所のことです。AWSは、アメリカ東部(バージニア)、アメリカ西部(北カリフォルニア)、アメリカ西部(オレゴン)、欧州(アイルランド)、アジア太平洋(シンガポール)、アジア太平洋(東京)、南米(サンパウロ)と世界で7カ所のデータセンターを提供(*編注:本書執筆当時)しており、利用者の場所によって使用するリージョンを変えることができたり、冗長化のために複数のリージョンを利用することができます。

 利用者の場所とリージョンが離れているとレイテンシ(遅延)が発生するので、例えば日本向けのサービス(主に日本のユーザが利用するサービス)の場合には東京リージョンを選ぶとレイテンシが抑えられます。例えば、日本からアメリカ東部のリージョンで起動したEC2インスタンスにSSHログインして作業する場合、レイテンシが発生するためコマンドのレスポンスがワンテンポ遅れて返ってくる感覚となります。

 AWSが提供しているリージョンについてはこちらにまとめておくので参考にしてみてください。

AWSの提供しているリージョン
地域 リージョン名 ホスト名
アメリカ東部(バージニア) us-east-1 ec2.us-east-1.amazonaws.com
アメリカ西部(北カリフォルニア) us-west-1 ec2.us-west-1.amazonaws.com
アメリカ西部(オレゴン) us-west-2 ec2.us-west-2.amazonaws.com
欧州(アイルランド) eu-west-1 ec2.eu-west-1.amazonaws.com
アジア太平洋(シンガポール) ap-southeast-1 ec2.ap-southeast-1.amazonaws.com
アジア太平洋(東京) ap-northeast-1 ec2.ap-northeast-1.amazonaws.com
南米(サンパウロ) sa-east-1 ec2.sa-east-1.amazonaws.com
(編注:本書執筆当時)

EC2インスタンス

 EMRではいくつかのインスタンスタイプの中から、用途に適したインスタンスを選択して利用することができます。利用可能なインスタンスタイプにはスタンダードインスタンス、ハイメモリインスタンス、ハイCPUインスタンス、クラスタコンピュートインスタンス、クラスタGPUインスタンスがありますが、主に利用するところだと以下のような特徴を持っています。

EC2の主なインスタンスタイプ
タイプ 説明
スタンダードインスタンス スタンダードなタイプ
ハイメモリインスタンス メモリが多めに搭載されているタイプ
ハイCPUインスタンス CPUが多めに搭載されているタイプ

 さらに、それぞれのインスタンスタイプには複数の種類が存在します。それをまとめたものが以下のようになります。なお、EC2の利用料金やEMRの利用料金※19はリージョンによって異なるので注意してください。以下は参考までに、アメリカ東部の料金についてまとめたものです。

 ※19 EC2料金と比べればだいぶ安いですが


EMRで利用できるインスタンスタイプ
インスタンスタイプ インスタンス
名称
メモリ ECU※ I/O性能 EC2料金 EMR料金
スタンダード インスタンス
スモール会合(デフォルト) m1.small 1.7Gバイト 1 標準 $0.08/時 $0.015/時
ラージ m1.large 7.5Gバイト 4 高速 $0.32/時 $0.06/時
エクストララージ m1.xlarge 15Gバイト 8 高速 $0.64/時 $0.12/時
ハイメモリ インスタンス
エクストララージ m2.xlarge 17.1Gバイト 6.5 標準 $0.45/時 $0.09/時
ダブル エクストララージ m2.2xlarge 34.2Gバイト 13 高速 $0.90/時 $0.21/時
クアドラプル
エクストララージ
m2.4xlarge 68.4Gバイト 26 高速 $1.80/時 $0.42/時
ハイ CPU インスタンス
ミディアム c1.medium 1.7Gバイト 5 標準 $0.165/時 $0.03/時
エクストララージ c1.xlarge 7Gバイト 20 高速 $0.66/時 $0.12/時
クラスタコンピュート インスタンス
クアドラプル
エクストララージ
cc1.4xlarge 23Gバイト 33.5 超高速 $1.30/時 $0.27/時
クラスタコンピュート
エイトエクストララージ
cc2.8xlarge 60.5Gバイト 88 超高速 $2.40/時 $0.50/時
クラスタ GPU インスタンス
クアドラプル
エクストララージ
cg1.4xlarge 22Gバイト 33.5 超高速 $2.10/時 $0.42/時
※ ECU(EC2 Compute Unite):1ECUは1.0-1.2GHz 2007 Opteronまたは2007 XeonプロセッサのCPU能力と同等の能力を提供する 編注:価格は本書執筆当時のものです。詳細はこちらを参照

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

AI for エンジニアリング
「サプライチェーン攻撃」対策
1P情シスのための脆弱性管理/対策の現実解
OSSのサプライチェーン管理、取るべきアクションとは
Microsoft & Windows最前線2024
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。