ニュース
レグザ、推しアイドルのライブも高画質にする次世代AI技術。CES2025で披露
2025年1月6日 10:00
TVS REGZAは、世界最大規模のテクノロジー見本市「CES 2025」にて、あいまいな言葉や会話でも目的のコンテンツが探し出せるボイスアシスタントや、アイドルなどのライブ映像も高画質にする次世代のAI技術をデモ展示する。CES 2025は、1月7日から10日まで米国ラスベガスで開催される。
同社は、CESに先立ち、展示内容を紹介する説明会を実施。取締役副社長を務める石橋泰博氏が登壇し、次世代レグザの技術ビジョンや開発中の新技術を披露した。
レグザがユーザーを深く理解する“レグザインテリジェンス”構想
冒頭、次世代レグザが目指すべきビジョンとして「レグザインテリジェンス」が発表された。
レグザインテリジェンスとは、同社がこれまで培ってきた生成AIやディープラーニング、センシング、人間工学などの最新技術を統合させた技術ビジョン。
具体的には、“知能”をもつレグザが、ユーザーの好奇心や価値観、嗜好や属性を把握。さらにレグザを使っている時の感情や体調などもリアルタイムに深く理解し、これまで以上に、ユーザーの心に刺さるコンテンツを推奨できることを目指す。
個人個人の興味関心に沿ったパーソナライズ性や、まだ見たことのない新たな発見を促す新規性、興味関心の幅を広げる多様性、状況に応じて即座にレコメンドするリアルタイム性を兼ね備えているのが、一般的なレコメンドシステムとの違い。石橋氏は「レグザインテリジェンスによって、大画面のさらなるユーザー体験・視聴体験を作り上げて行けると思っている」と話す。
実際の製品についての搭載時期は、「あくまでまだコンセプトの段階であり未定」(石橋氏)とのこと。また、ユーザーの嗜好や視聴履歴、属性、行動、生体データは「非常にセンシティブ」でもあるため、「個人データのプロテクトをしっかり担保しながら、どこまで活用していくのか? その塩梅を見極めながら引き続き研究開発して行きたい」とのことだった。
「それ」「あれ」でもコンテンツが見つかる次世代ボイスアシスタント
7日からのCES 2025で披露されるのは、前述の新コンセプトを実現するべく現在開発中という“ボイスアシスタント”“音声”“映像”の3つの技術デモになる。
まずボイスアシスタント技術が、「生成AIボイスナビゲーター」と呼ぶもの。これまでユーザーが行なってきた検索作業をレグザが“代行”し、あいまいな言葉と会話でも、見たいコンテンツを迅速にセレクトしてくれる技術だ。
説明会では、デモが披露された。
まずはボイスナビゲートを画面に呼び出す。ボイスナビゲートのビジュアルは“目玉”のような瞳アイコンで、まるでまばたきしているように瞳が閉じたり開いたり、動体物がある方向に瞳が左右に動いたりする。
次に、話者(デモ実演者)がレグザに向かって「30分くらい時間があるんだけど、何かおススメのコンテンツはあるか?」と話すと、レグザは1秒ほどで「『今話題の作品』『続きを視聴したい作品』」を提示。話者が「話題のやつお願い」と話すと、レグザはまた1秒ほどで「『GUNDAM』『LOVE LIVE! SUPERSTAR!!』」をレコメンド。「それで」と話すと、すぐに画面が切り替わり、画面上に「GUNDAM」作品が表示された。
ここで話者が「左から2番目」とコンテンツを選択。画面が「機動戦士ガンダムSEED DESTINI HDリマスター」に切り替わったところで、「それで」というと、実際にコンテンツが再生された。
アプリの起動やリモコンでのキーワード入力などをすることなく、“あいまいな言葉・会話”であっても、ユーザーの嗜好を考慮したうえで、目的のコンテンツに最短でリーチできるようになっているのがポイント。
「レグザが知能をもったように、ユーザーを“察して”くれるようになっている」「まるでレグザと会話をしているように、応答も非常に速い」(技術者)とのことで、CES会場ではバンダイチャンネルと協力し、ボイスナビゲートの魅力をアピールするという。
解説者の声がほとんど聞こえなくなる新しい音声技術
新しい音声技術が「AIオーディオリミックス」。AIがコンテンツの中から“声”と“環境音”を分離、それぞれを別々に音量コントロールすることができる。
サッカーとニュース映像を使い、AIオーディオリミックスの効果をデモ。サッカーの試合で“Voice”を選択すると、解説者の声だけが強調され、ナレーションがより聞きやすくなった。その一方、“Stadium”を選択すると解説者の声が“ほとんど聞こえなく”なり、スタジアムの歓声が強調されて、その場で観戦しているような臨場感が高まるようになっていた。
こうした音声分離技術や、ボイス強調機能は従来も似たような技術があるが、AIオーディオリミックスでは、ディープラーニングによる分離で任意の音だけを抽出・コントロールするため、「ほかの音が歪んだり、音色が変わったりなどの悪い影響が生じない」点が魅力という。
また「技術的には、うるさい解説者の声を完全に消すこともできるが、完全に消してしまうと逆に違和感が出るため、今回のデモでは、微かに聞こえる程度(10%)まで音量を絞っている」とのこと。
推しアイドルのライブ映像が高画質に
説明会では、発売中のレグザにも搭載されている映像技術“AIシーン高画質”の最新バージョンとして「AI音楽ライブステージ高画質技術」も披露された。
AIシーン高画質は、ネット動画や地デジ放送・HDMI入力映像に対して、コンテンツタイプ判別とシーン判別を適用させることで、シーン毎に独自の映像信号処理とパネル駆動処理を加え「その場にいるようなリアルな光景を再現」する技術。
既存製品では、「夜景」「花火/星空」「リング競技」「ゴルフ/サッカー」「映画」「アニメ」で機能していたが、次世代レグザでは“音楽ライブ”も判別できるよう開発を進めている。
音楽ライブでは、ステージ上のアーティストをよりクリアに見せるように信号を補正するほか、衣装の輝き感をアップ。さらに、演出で多用されるレーザー光線や、会場のペンライトのような華やかな光、影をリアルに再現するようにした。
リング競技との違いについては「ステージや照明など、『リング競技』と『音楽ライブ』は近い印象を受けると思うが、それぞれの処理は違っている。リング競技では、選手たちの筋肉の凹凸がより見えるようにしているし、ライトのハレーションも極力落とすようにしている。一方、音楽ライブは、アーティストがより綺麗に見えるようにしているし、衣装のラメのようなキラキラ感も強めた。遠景もパキっとさせながら、ハレーションも落とし過ぎないようにした」(技術者)という。
レグザへの導入については、「さまざまなシーンを研究している。音楽ライブもなるべく早期に導入できるよう、引き続き開発して行く」とのことだった。