ニュース

Google、レンズを指定でき、“幻覚”が減った動画生成AI「Veo 2」

劉尭

2024年12月17日 10:31

　Googleは12月、動画生成モデルおよび画像生成モデルに関連する最新アップデートを発表した。これらの一部はGoogle Labsを介して利用できるようになっている。

　1つ目は動画生成モデルの「Veo 2」。現実世界の物理法則や、人間の動きと表情のニュアンスに対する理解が深まり、高品質で高いリアリティを実現。ジャンル、レンズを指定し、映画効果などを提案すれば、最大4K解像度で数分におよぶ動画を生成できるという。レンズの焦点距離や被写界深度も指定できる。

　これまでのビデオモデルでは、余分な指や予期しないオブジェクトが「幻覚」として表示されることがよくあったというが、Veo 2では削減され、出力がよりリアルになるという。

　Veo 2にも目に見えないSynthID透かしが適用され、AI生成であることが識別できるようになっているため、フェイクの可能性を低減できる。まずはGoogle Labsのビデオ生成ツールである「VideoFX」に、Veo 2の機能を導入し、来年(2025年)にはYouTube Shortsやほかの製品を導入するとしている。

Imagen 3の例

　2番目は画像生成AIモデルの「Imagen 3」。より明るく優れた構成の画像が生成できるようになり、フォトリアリズム、印象派、抽象画、アニメスタイルなど多様なアートスタイルを備える。また、プロンプトへの忠実性も向上し、より豊かなディテールとテクスチャを実現する。Google Labsの画像生成ツールである「ImageFX」で展開し、世界100カ国以上で利用できる。

　3つ目は実験的な生成AIの「Whisk」。これはユーザーが提供する画像をベースに、主題、スタイル、シーンなどを選び、さらにテキストプロンプトを追加すれば、独自のスタイルやコンセプトの画像を生成できるツール。これは、Geminiの視覚的理解および説明機能を内部的に組み合わせ、Imagen 3に送り込むことで実現したという。現在は米国のGoogle Labsで提供している。