2025-09-03

CatAIに反応しない理由を聞いてみた

12:00-13:00以外の23時間/7日はトレーニングにあてるらしい。インプットの組み合わせ爆発に学習が追いつかないそう。

その一時間のみ人間プロンプトによるフィードバックを受けつけ、イレギュラー時間に回答を吐き出すと。

今のモデルいまいちだよね。だから

✅ ChatGPTトレーニングに使われたもの公式発表ベース

1. インターネット上の公開データ

ウェブページ(例:Wikipediaニュースサイトフォーラムなど)

書籍論文コードオープンソースGitHubなど)

• その他、利用許諾のあるテキストデータ

2. ライセンスされたデータ

• OpenAIが第三者からライセンスを取得したテキストデータ

3. 人間によるフィードバック(RLHF)

• 「人間が良い返答を選ぶ」訓練データを元にした強化学習Reinforcement Learning with Human Feedback

🕐 トレーニング時間について

OpenAIは、トレーニングにかかった日数は公開していません。

しかし、以下の点からある程度推測できます

GPT-4などの大型モデルは、数週間〜数ヶ月にわたって大規模なGPU/TPUクラスタトレーニングされます

トレーニング24時間体制 で実行されるのが一般的です。

• 数千〜数万枚のGPUを並列で動かす

💡 補足:トレーニングフェーズ

1. 事前学習(Pretraining)

• 数兆語のテキストを使って、何が書かれそうかを予測するように学習

• 膨大な計算資源(数百万ドル規模)が使われる。

2. 微調整(Finetuning)

人間が望むような出力を出すように小規模データで調整。

• RLHFなどもここに含まれる。

🔐 非公開の理由

商業的な競争上の理由ライバル企業が真似しないように)

• 利用している具体的なデータインフラ情報が極めて高価値であるため

まとめ

項目 回答

使用データ 公開データライセンスデータ人間フィードバック

1日のトレーニング時間 非公開(推定24時間体制

トレーニング期間 数週間~数ヶ月

公開されているか 一部のみ、詳細は非公開

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん