SAPは米国時間9月1日、「SAP HANA Vora」という新たなテクノロジを発表した(ちなみにVoraという名前は、「食欲旺盛な」という意味の「voracious」に由来しており、データに対する旺盛な意欲を表している)。このテクノロジは、ビッグデータとビジネスインテリジェンス(BI)が相互補完関係にあるという考えを具現化したものとも言える。Voraは、既存製品である「SAP HANA」や、ダウンストリームに位置付けられる「SAP Business Warehouse(BW)」や「SAP BusinessObjects」「SAP ERP」と、「Apache Hadoop」や「Apache Spark」といったビッグデータテクノロジを融合するものだ。これにより、BIスタイルの多面的な分析(ドリルダウン分析)がビッグデータの世界にもたらされる。
既存テクノロジと新規テクノロジ
HANA Voraは、Apache Sparkと「Hadoop 2.0/YARN」の組み合わせがベースとなっている。そして、プッシュダウンクエリの委譲によって既存製品であるSAP HANAとの接続機能を提供する。また、「Spark SQL」も利用可能となっているため、リレーショナルデータベースやデータウェアハウスが何年にもわたって使用してきている階層型のクエリやコンパイル済みクエリと同等の機能も実現している。
要するにVoraは、データレイクと、企業の保有する体系化されたデータを、データ移動というコスト(「今までの」HANAでは独自のクエリを実行するため)を発生させることなく連携させるものと言える。さらに、多元的な階層定義を実現するとともに、Voraが取り扱うすべてのデータに対する分析クエリで、その定義を使用できるようにする。
専用ハードウェアは不要
Voraは、HadoopやSparkが配備されているクラスタノードと共存するため、専用のハードウェアインフラを必要としない。既存のHANAにVoraを統合する場合にはもちろん、HANA自身のインフラが必要だ。しかし、Voraは追加のハードウェアを必要とせず、スタンドアロン形式でも使用できる。
Voraは、HadoopやSpark、ビッグデータといったテクノロジの利用を進めたいSAPの顧客にとって、極めて妥当な方法となる。VoraはSAPによって提供されている商用ソフトウェアであり、オープンソースソフトウェアではないため、何らかの戦略変更に踏み切らずとも、既存のビジネスモデルに適合させることができる。
絶妙の組み合わせ
Voraは、さまざまな点で絶妙の組み合わせを実現している。具体的には、ビッグデータとBI、そして新興テクノロジと実績のあるエンタープライズソフトウェア、データレイクと入念に体系化されたデータ、インメモリとディスクをベースにしたストレージや処理だ。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。