日本ユニシスは2015年7月7日、ビッグデータ分析のためのソフトウエア一式を月額制のクラウドサービスとして提供する「データ統合・分析共通PaaS」(図)を発表、同日提供を開始した。DWH(データウエアハウス)構築用の並列RDBMS(リレーショナルデータベース管理システム)とHadoopを中核とし、さらにこれらを組み合わせて活用するデータ統合ソフトを提供する。ビッグデータ分析基盤を初期投資を抑えて導入できる。
料金(税別)は、初期構築費用が100万円で、月額利用料が75万円から。PaaS自体の売上やデータを活用する業務アプリケーションの開発などで、今後3年間で50億円の販売を目指す。ソフトウエア一式を稼働させるIaaS基盤としてはAWS(Amazon Web Services)を利用している。今後、Microsoft Azure上でも提供する予定。
大きく三つのソフトをクラウド型で提供する。(1)データを収集して加工/蓄積するエンジンとして、マップアール・テクノロジーズのHadoopディストリビューション「MapR」を提供。(2)データを統合したり分析したりするためのDWHエンジンとして、日本ヒューレット・パッカードの「HP Vertica Analytics Platform」(HP Vertica)を提供。(3)これらを組み合わせて活用するデータ統合ソフト「汎用データ処理ツール」は、日本ユニシスが自社開発した。
汎用データ処理ツールを使うと、MapRとHP Verticaを用いて、各種データの収集、形式変換やクレンジング、マスターやテーブルの更新、データ分析結果をBIソフト参照、---といった、ビッグデータ分析/活用に必要な一連の作業を実施できる(表1)。この結果、データを収集/蓄積して分析する業務アプリケーションやBIシステムを容易に構築できるようになる。一方で、汎用データ処理ツールを使わない場合、同等の機能を実現するには、MapRとHP Verticaの機能を理解した上でJavaによるプログラミングが必要になる。
モジュール名 | 機能 |
---|---|
データ取得 | ユーザー企業がアップロードした各種ファイルを取得し、MapRサーバーの所定フォルダーに転送する |
データ加工 | 「データ取得」で取得したファイルに対して形式加工を実施し、標準のCSV形式に変換する(区分コード設定、変更、データクレンジング処理を含む) |
蓄積 | 整形済ファイルをMapRサーバーに蓄積(バックアップ)する |
データロード | 整形済ファイルを所定のHP Verticaテーブルに登録する |
マスター更新 | マスター関連テーブルを連携するデータ内容で全件更新する |
結合テーブル更新 | 連携するデータ内容で統合テーブルを更新する |
データ統合 | ひも付けた情報をもとにマスターデータとトランザクションデータを統合する |
データ分析 | 協調フィルタリングを実施する。購買履歴などをもとに、行動・購買が類似した他のユーザーの情報を用いて推論し、訴求の対象とする商品や顧客のリストを作成する |