米Twitterは米国時間2011年8月4日、同社が先月買収した米BackTypeのリアルタイムデータ処理技術「Storm」をオープンソースとして公開すると発表した。ミズーリ州セントルイスで開催される技術カンファレンス「Strange Loop 2011」に合わせ、9月19日にリリースする。

 BackTypeはソーシャルメディアのデータ解析を手がける新興企業で、Twitterの投稿(ツイート)を解析するサービス「BackTweets」などを展開していた。買収後、既存ユーザーへのBackTweetsの提供のみ継続し、他の製品やAPIサービスは中止した。同社のサービスは米Microsoftや米AOL、米Timeなどが採用していた(関連記事:Twitter、ソーシャルメディア解析のBackTypeを買収)。

 TwitterのNathan Marz氏によると、Stormは分散処理ソフトウエア「Hadoop」に非常によく似ているが、Hadoopは実行するジョブがいずれ終わるのに対して、Stormは中断させない限り永遠にジョブの処理が続く。また、他のCEP(複合イベント処理)ソフトウエアと異なり、外部データストレージを利用する。用途としては、新たなデータや更新データのリアルタイムのストリーム処理、クエリーやストリーム分析結果のリアルタイムの視覚的提示、大規模な演算能力を必要とするクエリーの並列化など、をMarz氏は挙げている。

 Marz氏は同時にStormの仕組みについて「表面をなぞる程度」(同氏)の解説をブログに掲載しているが、開発者がすぐにStormを利用できるようにするためのドキュメントを9月19日までに準備するとしている。

[発表資料へ]