分散ファイルシステムにアクセスする口としてのNFSはクライアントが分散環境の恩恵を受けることができない(NFSクライアントからのサーバコールが1箇所に集約されるので簡単にボトルネックになる)のでそんなにメリットはないんだけど、HDFSの中身を適当にのぞいて回るくらいの用途ならそれなりに便利ではあるので動作確認がてらCloudera Manager 5でHDFS NFS Gatewayを有効にする手順を確認してみます。
まずサービスの一覧からHDFSを選択します:
HDFSサービス画面からインスタンスのタブを選択します:
ここで "Add" ボタンをクリックしてロールの追加を行ないます:
NFS Gatewayを選択します:
Quickstart VMなのでロールを配置するホストに選択肢はありません:
NFS Gatewayが追加されました:
状態が "Stopped" になっているので nfsgateway にチェックを入れて Actions for Selected から開始してやればOKです。これだけでHDFSの / がまるっとexportされます:
Hueで見えてるのとNFSマウントしてファインダから見てるのが同じだということが確認できますね:
ドラッグ&ドロップでHDFSにファイルを放り込んでみようと思ったんですがユーザIDの対応関係が適当だったんで書き込めませんでした。これはセキュリティ的に正しい姿ですね。
別のLinuxホストにHDFSに書き込む権限を持つユーザと同じユーザID, グループIDを持つユーザを作成してNFS Gateway経由でアクセスしたら問題なく書き込むことができました。
今回はCloudera Manager 5を利用して取り敢えず試してみただけのお知らせでした。@kernel023のブログ記事 CDH5ベータ1のNFSv3ゲートウェイを試してみました と比較してみるとコマンドラインを一切書いてないのに気付くと思います。コマンドプロンプトとかシェルが嫌いな人には絶賛Cloudera Managerをお勧めします。そうでない人も使うべきというか、これなしで大規模クラスタの運用管理ってムリですよね実際...