いろいろと人間を超えてきた。
ChatGPTのリリース以来、一気にAIの台風の目みたいになってしまったOpenAI。彼らはChatGPTのコアにある大規模言語モデル(LLM)をアップデートし、GPT-4としてリリースしました。これは少なくとも机上では、今までみたいな汎用的な言語モデルとして使えるだけでなく、用途に合わせて微調整ができ、よりいろんな分野で実用化されることを意図したモデルです。
OpenAIの発表によれば、GPT-4は前バージョンのGPT-3.5より正確で問題解決能力が高いそうで、問題の種類によっては人間より優れているかもしれません。
GPT-4で各種試験のシミュレーションをしたところ、米国統一司法試験では受験者中上位10%、国際生物学オリンピックでは上位1%に入り、それぞれ合格できる水準のスコアを獲得しています。先代のGPT-3.5では、これらのテストでそれぞれ下位10%、下位31%のスコアしか取れていませんでした。
さらに新システムでは最大2万5000ワードの文章(ざっくり20ページくらい)まで扱えるようになりました。GPT-3.5では「2,048言語トークン」、または1,500ワードが限度だったので、より長い文章生成が可能になりました。今までも小説一本ChatGPTで書こうとする猛者はいましたが、GPT-4では単に文章が長くなるだけじゃなく、質的にもよりまとまったものになる、そうです。
OpenAIはGPT-4の開発に6カ月を投じ、「許可されないコンテンツ」へのリクエストに回答する可能性を82%低減、事実に基づく回答を可能性を40%向上させられたとのこと。もちろん我々は、今までのChatGPTがどれくらい誤情報を言ってたのか、禁止コンテンツを出してたのかといった、OpenAIの内部データを見ることはできません。OpenAIの外の人間で新システムを試せた人はまだ少なく、こうした数字の検証はしっかりできていません。
現時点でGPT-4にアクセスできるのは、OpenAIが選んだいくつかの会社か、ChatGPT Plusユーザー(月20ドル払ってる人)の中でもごく一部のラッキーな人だけです。でも、GPT-4 APIのウェイティングリストがあるので、アクセスしたい人が登録しておけばそのうち使えるようになるはずです。
GPT-4は入力として文字だけでなく画像も受け入れられるので、例えば画像にキャプションを付けたり、画像分析結果を言葉にすることが可能です。
OpenAIが挙げた例では、いくつかの食材を写した画像を入力すると、システムがその食材で作れる料理を回答しました。冷蔵庫の中身の写真から、レシピを教えてくれたりするわけです。ただOpenAIのサム・アルトマンCEOは、ビジュアル入力を「プレビュー中」だとツイートし、「安全性の問題を軽減するために多少時間が必要」とも言ってます。
パフォーマンスと制約と
OpenAIの共同創業者兼プレジデント、グレッグ・ブロークマン氏は、GPT-4のパフォーマンスを示すデモをいくつか行いました。例えば「ニュース記事を1文にまとめつつ、文中の単語の始まりを全部同じ文字にする」といったタスクを課し、実際指定通りの文が出力されてます。また彼は、ユーザーがシステムに新たな情報を与えて、システムがそれを分析する流れも示しました。
ブロークマン氏は、GPT-4のシステムは比較的動作が遅く、特に複雑なタスクには時間がかかると言いましたが、1リクエストに数分以上かかることはないそうです。彼はGPT-4にDiscordボットのコードを書かせて、リクエストを何回も書き直し、エラーメッセージまで入力し、ちゃんと完成させてました。また架空の夫婦の確定申告をサポートするようなデモもありました。
ただ一方で、ブロークマン氏は何回も、「人間が作ったものでも、AIのものでも、信頼できないコードを動かしてはいけない」こと、確定申告作業をAIに委ねちゃいけないこと、GPT-4からの出力全般を鵜呑みにしちゃいけないことを繰り返しました。
「これ(GPT-4)はパーフェクトではありません。でも、人間もそうですよね」
良くも悪くもすべてに生成AIが浸透
OpenAIはMicrosoftから数十億ドルの出資を受け、Microsoft Azure上のスーパーコンピューターでGPT-4の学習を進めました。アルトマン氏は、GPT-4は「前のモデルよりクリエイティブで、でっちあげを吐き出すことははるかに少なく、バイアスも少なくなっている」と言います。それでも、第三者がGPT-4を使ってフィードバックすることを期待しています。
既にGPT-4を使った会社がないわけじゃありません。言語学習アプリDuolingoは同日、「Duolingo Max」という有料プランを発表しました。アプリにはGPT-4を使った新機能があり、AIがユーザーの間違いについて「文脈固有の解説」をしてくれるそうです。AIチャットボットとの会話練習もできます。
OpenAIとしては、こんな風にAPIを使ってくれる企業を増やしたいわけです。アルトマン氏は、新システムでは挙動のカスタマイズがより柔軟にでき、デベロッパーが利用目的に合わせてモデルを微調整できると言ってました。GPT-4を既に使っている企業・組織は、他にモルガン・スタンレー、カーンアカデミー、アイスランド政府などがあります。
OpenAIは、GPT-4にはまだ「制約が多いことがわかっている」と言っています。それは例えば社会的バイアスやハルシネーション(答えに詰まるとでっちあげを出力)、悪意のある入力への対応などです。新システムの性能が向上したといっても、悪用する余地はまだまだあります。
著名なフィクション雑誌にChatGPTを使った作品が押し寄せ、投稿受付停止に追い込まれる例も出てきました。GPT-4が今まで以上に長文を書けるようになり、今後ネット上にはそんなAIの書いた文章がますます溢れそうです。