7. 分散ファイルシステム HDFS
NameNode (Master)
DataNode (Slave)
クライアント
②
③
①
①
①
ファイル
Heartbeat
メタ情報 管理
ブロック 管理
DataNode 状態監視
ブロックの 保存
1つのブロックを複数のDataNodeで保存 → 任意のDataNodeが故障してもデータを失わない
ブロック
①
③
③
③
②
②
②
12. MapReduce Framework
JobTracker (MASTER)
TaskTracker (SLAVE)
クライアント
②
③
①
タスク実行中
タスク実行待ち
タスク実行(競争)中
MapReduce ジョブ管理
タスク 管理
Heartbeat
TaskTracker 状態監視
MapReduce ジョブ
M
R
同じ処理の投機的実行
データのローカリティを意識した タスクの実行
Map
Map
Reduce
M
R
M
R
M
Map,Reduce タスクの実行