コンピュータビジョン最前線 Winter 2023
【最新動向サーベイ】
・イマドキノ一人称ビジョン:人の身体に軽量小型のウェアラブルカメラを装着し、装着者自身の視点から見た映像を撮影することで自身およびその周辺の環境を理解する一人称ビジョンについて、浅く広く、応用や実践も含めて紹介。
【論文フカヨミ】
・フカヨミStable Diffusionと脳活動:Stable Diffusionと名付けられた潜在拡散モデルの各要素やプロセスが、脳内の活動とどのように対応しているかを探ることで、生物学的に拡散モデルの解釈を試みた研究について紹介。加えて、新たな深層学習モデルの訓練を必要としないシンプルなデコーディングの枠組みも提案。
・フカヨミ音響情報のCV応用:本稿では音と画像を活用した研究をおおまかに、意味情報をもつ音響信号を用いて人物姿勢や画像を生成するモデルと、反響音から室内の3次元空間情報を推定するモデルに大別し、それぞれの代表的な研究について解説。
・フカヨミ潜在空間で画像編集:表現空間における座標系に注目し、生成される画像を高品質に編集できる手法deep curvilinear editing (DeCurvEd) を紹介。
【チュートリアル】
・ニュウモン拡散モデル:前々号(Summer 2023)掲載の「イマドキノ拡散モデル」では、拡散モデルの基礎を踏まえつつも、最新の研究動向を体系的に広く紹介することに主眼に置いた。今回はチュートリアル記事として前回よりさらに大きく紙面を割き、爆発的な進展の中で登場した数多くの技術の中でも特に広く使われているものを中心に、そのアイデアや技術の詳細を紹介。
その他、漫画「君も魔法をかけてみよう!」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。
イマドキノ一人称ビジョン―「私」の目から見える世界を理解する技術―(八木拓真)
フカヨミStable Diffusionと脳活動―ヒトの脳活動を用いた画像生成モデルの理解と活用―(高木 優・西本伸志)
フカヨミ音響情報のCV応用―画像と音を用いた最新AIの研究動向!―(柴田優斗)
フカヨミ潜在空間で画像編集―大きさ・色・形,思いどおりに画像を編集!―(青嶋雄大・松原 崇)
ニュウモン拡散モデル―画像生成の新たなフロンティアへの招待―(石井雅人・早川顕生)
君も魔法をかけてみよう!(春嵐)
CVイベントカレンダー
関連書籍
-
コンピュータビジョン最前線 Spring 2023
価格:3,300円(税込)
-
コンピュータビジョン最前線 Summer 2023
価格:3,300円(税込)
-
コンピュータビジョン最前線 Autumn 2023
価格:3,300円(税込)