エンタープライズDX
日本情報通信
データレイクハウスを基盤に
データ統合と生成AIの利活用を促す
オンプレミスやクラウドに分散したデータの統合や一元管理を可能にする、データレイクハウスが注目されている。日本情報通信はその基盤としてIBMの「watsonx.data」を提案する。データ基盤の統合に加え、生成AIの利活用に必要な基盤をパッケージとして提供。企業が蓄積してきた各種データを生かしつつ生成AIの業務利用を支援する。

日本情報通信株式会社
データ&アナリティクス事業本部
テクニカルセールス部 第3グループ
田原 久也 氏
オンプレミスとクラウドにデータが分散し、データをうまく活用できないという課題を抱える企業は少なくない。例えば小売業の場合、実店舗とECサイト上のシステムが分かれているため、顧客や販売データの横断的な分析ができないというケースがある。こうした課題の解決策となるのが、データレイクハウスだ。「データウエアハウスとデータレイクのいいとこ取りをしたデータ基盤となります」と、日本情報通信の田原久也氏は説明する。
データレイクハウスは多種多様なデータフォーマットをサポートし、構造化データと非構造化データの対応やデータ整合性の維持が可能だ。基盤の異なるデータの分析や機械学習も利用できる。前述した小売業の場合、売り上げ情報や顧客情報の構造化データとWebページのアクセスログなどの非構造化データを同じデータレイクハウス基盤に統合することで、最新の顧客データや売り上げ情報を異なる基盤を横断する形で分析できる。
データ基盤の統合と生成AIの
利活用を実現するwatsonx.data

日本情報通信株式会社
データ&アナリティクス事業本部
テクニカルセールス部 第3グループ
大内 洸輝 氏
データレイクハウスのデータ基盤となるのが、「watsonx.data」だ。業務に応じて適切なエンジンを割り当てる「エンジン層」、異なる基盤上のストレージへの横断的なデータ参照を可能にする「カタログ層」、オンプレミスやクラウドなど複数のストレージをまとめて管理する「ストレージ層」の3層構造となっており、「ストレージ層は実データを持たず、既存のデータウエアハウスやクラウドにデータを保持したままデータを横断的に参照できます」と田原氏。watsonx.dataの活用により、統合基盤の構築にコストをかけず、かつデータの鮮度を保ったまま横断的なデータ活用が可能になる。
また、watsonx.dataは生成AIの利活用を促進する基盤にもなる。テキストや音声、動画などをベクトルデータに変換して管理し、類似度検索を可能にするベクトルデータベース「Milvus」が含まれる。日本情報通信の大内洸輝氏は、「ベクトルデータベースとwatsonx.aiを組み合わせることで、生成AIの検索対象を拡張するRAG(検索拡張生成)のシステムを構成できます」と語る。
RAGとは生成AIの回答精度を高める仕組みである。質問に類似した情報をベクトルデータベース内から検索するほか、学習していない情報についても外部から参照することで、社内固有の情報なども回答できる。例えばコールセンターの対応履歴や、アナリストの分析結果をwatsonx.dataのベクトルデータベースに格納すると「チャット形式で回答するなど、企業が蓄積してきたデータを基に生成AIを利活用できます」(大内氏)。IBM watsonxシリーズの活用で、横断的なデータ分析や生成AIの業務利用は飛躍的に進むだろう。
お問い合わせ
- 日本情報通信株式会社
- URL:https://www.niandc.co.jp/sol/ibm-watsonx/