AI小説の執筆、だいぶ慣れてきました。そして、browser-useというソフトが面白いです。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第77回)では、テキストから物理シミュレーションを生成するAIを内蔵した高速物理エンジン「Genesis」、GPT-4oやClaude-3.5-Sonnetに匹敵するオープンソースの大規模言語モデル「DeepSeek-V3」を取り上げます。
今回は、AI教師が囲碁を生徒に指導すると学習効果はどうなるかを調査した研究論文「Can Artificial Intelligence Improve Gender Equality? Evidence from a Natural Experiment」に注目します。
年末ということで、生成AI画像の2024年をバックナンバー見つつ、ざっくりおさらいしてみたい。
みなさん、AIサブスクしてますか?
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第76回)では、アニメの自動彩色と中間フレームを生成できるAIモデル「AniDoc」と、Metaの動画理解AIモデル「Apollo」をご紹介します。
すでに2024年のベストバイとして、オープンイヤーイヤホンの「nwm DOTS」を挙げた筆者ですが、実はもう一つ、ベストバイとして挙げたいデバイスがあります。それがウェアラブルAIメモリーカプセル「PLAUD NotePin」です。
最近、AIに小説を書いてもらっています。
人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第3期第2回を12月26日に開催いたします。
OpenAIが最近発表したAIモデル「o3」と汎用人工知能(AGI)について、AGIの性能を評価するベンチマーク「ARC-AGI」の開発者フランソワ・ショレ氏(Googleの研究者)が考察した記事に注目します。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第75回)では、Microsoftの新しい言語モデル「Phi-4」や、カメラ越しに映る現実をリアルタイムに理解するAIモデル「IXC2.5-OL」を取り上げます。
VOCALOIDが発売から20年を迎え、ヤマハの特設ページが公開されました。継続的にVOCALOIDの新技術を試して記事にしていた筆者もお祝いのメッセージを書いています。
FLUX.1 Toolsとは?
今年2024年は生成AIの、特に動画において画期的な進歩が継続して行われた年でした。この連載でもずっと追いかけてきたテーマでもあるので、特に動画生成AIについて、自分が作った動画で振り返ります。
128GB M4 Max MacBook Pro、予約しただけで記事を書いた私ですが、ようやく届いたので、いろいろとやりたかったことを試しています。
AIたちが「答えが分からない」と自身の無知を認識できるかを検証した論文「The Impossible Test: A 2024 Unsolvable Dataset and A Chance for an AGI Quiz」を取り上げます。
現在大田区役所では、東京都の次世代通信技術活用型スタートアップ支援事業のもと、avatarinとともにローカル5Gを含む次世代通信技術を活用した実証実験を行っています。
自分の半生を描いたドキュメンタリー作品がYouTubeで公開されます。
Googleは、人間がタスクを与えると自律的に実装計画を立ててコードの生成や変更、バグフィクスなどを実行してくれるAIエージェント「Jules」を発表しました。
Googleが新OS『Android XR』を発表しました。
OpenAIが12日間、新機能を発表する「12 Days of OpenAI」、6日目はChatGPTのAdvanced Voice Mode(高度な音声)の新機能について。
Apple Intelligenceはまだ日本語では使えませんが、英語モードにすれば利用可能です。本日アップデートされたiOS 18.2ではChatGPTとの統合に加え、待望のAI画像生成機能「Image Playground」が追加されました。その機能を試してみます。
OpenAIは、ChatGPTの新しい有料プラン「ChatGPT Pro」を発表しました。価格は月額200ドルで、最高レベルの「OpenAI o1」を含むすべてのモデルを無制限で使用することができます。
人気のため一時はアカウント作成ができない状態だったSoraですが、ようやくアカウントを作成し、ログインできたので試してみました。
OpenAIの動画生成AI「Sora」がついに公開されました。
中国の南京大学やドイツのMax Planck Institute for the Science of Lightに所属する研究者らが、AIシステムを用いて量子もつれの新しい生成方法を発見した論文「Entangling Independent Particles by Path Identity」を解説します。
OpenAIアドベントカレンダーこと「12 Days of OpenAI」、が始まりました。初日はChatGPT Pro(月額200ドル)とo1完全版を発表しました。
毎年この時期に大きな発表をするのが慣例となっているOpenAIですが、今年は1回では収まらず、12日連続(ただしウィークデーのみ)のライブストリーミングで行うことをXへのポストで予告しています。
Amazon Web Services(AWS)が米ラスベガスで開催中のイベント「AWS re:Invent 2024」で、基調講演にAmazon CEOのアンディ・ジャシー氏が登壇。同社が開発した新しい基盤モデルである「Amazon Nova」を発表しました。
NVIDIAが主導して開発した、高解像度の画像を高速に生成するモデル「Sana」と、テキストから3Dアセットを生成するAI「Edify 3D」などを紹介します
今朝見た夢をAIで再現しようと思います。
猫も杓子も128GB M4 Max MacBook Proなのはどういうことでしょうか。
AIフェスティバルでは、AIアートグランプリ受賞者とのディスカッションや基調講演が行われ、技術の進化に関する多様な議論が展開された。
大規模言語モデル(LLM)の数十億のパラメータの中でたった1つのパラメータを削除するだけで、モデルのテキスト生成能力が完全に崩壊することを発見した論文「The Super Weight in Large Language Models」について解説します。
「最も簡単にオリジナル曲のリップシンクミュージックビデオを作る方法」について解説します。まあ、自分で弾き語りするのが一番簡単なんですが、それは置いといて(笑)
イスラエルのネゲヴ・ベン=グリオン大学(BGU)と富士通の研究チームは、一部の自動運転 / 先進運転支援システム搭載車が停止中の緊急車両に衝突する事故は、システムが「デジタルてんかん発作」を起こすのが原因かもしれないとする研究結果を報告しました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第73回)では、生成AIでコンピュータを操作する「Claude 3.5 Computer Use」の性能調査や、動画内の動く物体を追跡し分離するAI「SAMURAI」を取り上げます。
Detail Daemonとは?またその効果は?
Luma AIは動画生成AIサービスのDream Machineに大きな改変を施しました。
さくらインターネットは、生成AIのプラットフォームサービスの開発に着手したことを発表しました。
実在する人の性格や考えを忠実にコピーしたAIエージェント(自律AI)を1000体以上生成した論文「Generative Agent Simulations of 1,000 People」を取り上げます。
AivisSpeechとは、日本で開発されたAI音声合成ソフトで、いくつかのプリセットボイスが使える推論用アプリがMac、Windows向けに提供されており、すぐに試すことができます。