写真●NTTデータの山田伸一常務(左)と、クラウデラのマイケル・オルソンCEO(最高経営責任者、右)
写真●NTTデータの山田伸一常務(左)と、クラウデラのマイケル・オルソンCEO(最高経営責任者、右)
[画像のクリックで拡大表示]

 NTTデータが、オープンソースの分散バッチ処理ソフト「Hadoop」を使ったシステム構築事業で、2012年度に100億円を売り上げる目標であることが明らかになった。2010年10月12日(米国時間)に米国ニューヨークで開催された「Hadoop World 2010」で、NTTデータの山田伸一常務が発表した。2012年度までに30件のシステム構築、100件のサポート契約を目指す。

  Hadoopは分散処理システムを構築するためのミドルウエア。一般的なPCサーバー100台で、およそ200Tバイトのデータを解析できる大型データ分析システムを構築できる。NTTデータは2010年7月に、Hadoopを使ったシステム構築・運用支援サービス「BizXaaSクラウド構築サービス Hadoop構築・運用ソリューション」を開始。10月にはHadoop専業ベンチャーの米クラウデラと提携し、クラウデラ製のHadoopディストリビューションや開発ツールを、日本・アジア太平洋地域で販売することになった(写真)。

 Hadoopを使ったシステムは、通信業や金融業、広告業、流通業などに売り込む考え。具体例としては、POSデータを解析して顧客の動向を分析するシステムや、Webサーバーのログを解析して広告最適化を支援するシステム、金融工学分野におけるシミュレーションシステムなどを挙げている。これらは従来、リレーショナルデータベースやデータウエアハウス構築ソフトなどを使用していた領域である。

 NTTデータには現在、Hadoopの基盤技術を開発、検証する技術チームが11人、Hadoopのアプリケーションを開発するチームが50人在籍する。開発拠点の一部は、中国の北京にもある。2012年度までに10億円を投資して、Hadoop関連システムの開発体制を強化する。

 クラウデラが米国などで実施しているエンジニアを対象とした教育サービスも、NTTデータが日本で提供する。開発者向けの「Hadoop Training for Developers」、システム管理者向けの「Hadoop Training for Administrators」、Hadoopをベースにしたデータベース「Hbase」を学ぶ「HBase Training」、Hadoop用のデータウエアハウスツールである「Hive」や「Pig」を使ったデータ処理を学ぶ「Analyzing Data with Hive and Pig」といった研修コースを提供する予定。

 Hadoop World 2010でNTTデータが行った講演には、ユーザー企業としてリクルートも登壇。リクルートがWebサーバーのログなどを解析するシステムを、Hadoopを使ったデータウエアハウスを構築するためのミドルウエア「Hive」を採用して構築することなどを明らかにしている。