名前を隠して楽しく日記。
ただのdata augmentationじゃん
亀田買ってみようかな
・はじめに
今回の記事は特定の国や人種を差別する意図は一切ありません。実際の出来事を元にSNS上での誹謗中傷や荒らし行為がもたらす影響について考察、教訓を共有する目的で執筆したものです。
【eスポーツ界の影!!!VALORANTで見えた荒らしコメントの裏側】
最近話題のeスポーツ。その中でも、FPS(ファーストパーソンシューティング)の人気タイトル「VALORANT」は、2022年に日本のZETA Divisionが世界大会で堂々の3位に輝いたことで、日本国内での人気がさらに急上昇しました。
だが、人気になると同時にチームや選手への誹謗中傷が増え始めた。チャット欄は国際戦で日本チームが負けると「日本は弱い」「外国人傭兵がいないと勝てない」といったような所謂荒らしコメントのような物が頻発ようになった。
きっかけは些細な事であった。VALORANTの大会で日本のチームが劣勢になると毎度おなじみのように「日本は弱い」という荒らしコメントが流れてきた。またいつもように変な奴が暴れているな、と冷たい目で見ているとそのユーザーはアカウントのリンク先にSNSのリンクを貼っていたのである。私は興味本位でSNS はリンクをクリックしてみた。すると驚きの光景が広がっていました。
そのアカウントは誹謗中傷した人間の個人情報が余す所なく載っていたのである。
SNSのユーザー名は荒らしていたチャット名とほぼ変えていなかった。そしてそのSNSには個人情報がびっしり。驚いた事に自撮りの写真を堂々と加工もせずにSNSにアップして背景からどの大学に所属しているのかすら簡単に特定できる状態でした。さらに、投稿内容を調べると以下のような情報が浮かび上がりった。そのSNSの情報をまとめると
・いわゆるチー牛顔
などが確認された。
私は思った「「なんでそんなに日本が嫌いなのに日本に来てるの!?!?」
【教訓】
今回荒らし相手を特定してみて現代のSNSではどこの誰か発信しているのかも分からない誹謗中傷をストレートに受け取ってししまう様なことは人生の浪費にすらならないという教訓を得た。SNSで飛び交う誹謗中傷の多くは、顔の見えない誰かの無責任な発言である。そんなものに感情を振り回されるのは時間の無駄。自分の人生を豊かにするために、くだらないコメントはスルーするのが一番だと痛感した。
今のAIは学習データを食い尽くしたから徐々に出来が悪くなっていくみたいな言説を見たが、今の生成AIはモデルの”発展のため”にAIが生成したデータを使っている
去年の12月中頃に破壊的な安さと性能の高さ(ほぼ最新のモデルと遜色ない性能がある)で話題になったDeepSeek v3は15兆トークンで学習されているが、少なくとも半分近く、多ければ80%近くがAIが生成したデータを使っていると見られている
データの生成はGPT-4oやLlama3.1などのモデルが使われているんだとか
DeepSeek v3はフロンティアモデルではないが、この大成功の経験からフロンティアモデルの事前学習にもAI生成データがかなりの部分占めることになるだろう
そもそもGPT-4oやOpenAI-o1はほぼ確実にAI生成データを使っている
このトレンドが続く限り(自分は将棋のAIと同じく終わらないと見てる)データの枯渇はないだろう
言語には十分な複雑性があったってことだろう
多分画像にもこの程度の複雑性はある
フジテレビの件で思うのは、接待の強要みたいなものがあって、「主犯」たる上層部の人間がいたとして、「実行犯・共犯」たる現場の人間も大勢いるはずなんだよな
場所のセッティングをしたり、飲み会っぽく調整したり、途中で退席するのを口裏合わせたりとかして
そういう「流されるタイプの悪」みたいのも相当タチが悪い
昨日は朝から晩まで、チャーン・サイモンズ理論の深淵に没頭していた。朝食は当然、規定量のオートミールと温かい豆乳。タンパク質と繊維質のバランスは、脳の活動効率に直結するからね。
午前中は、ウィッテン教授が提唱したチャーン・サイモンズ理論と共形場理論の関連性について再考していた。特に、SU(2)ₖ チャーン・サイモンズ理論におけるウィルソンループの期待値が、対応するWZW模型の相関関数と一致するという驚くべき事実は、僕の知的好奇心を大いに刺激する。しかし、僕が今取り組んでいるのは、より複雑なゲージ群、例えばE₈の場合だ。E₈は例外型リー群の中でも最大のもので、その表現論は非常に複雑だ。
午後は、このE₈チャーン・サイモンズ理論における結び目不変量の計算に挑戦していた。特に、結び目理論における「彩色ジョーンズ多項式」の概念を拡張し、E₈の場合に一般化することを試みている。この計算は途方もなく複雑で、通常の数学的手法では手に負えない。そこで僕は、最近開発した新しいアルゴリズム、「超幾何級数を用いた漸近展開法」を応用することにした。この方法を用いることで、今まで不可能と思われていた高次表現における彩色ジョーンズ多項式の漸近挙動を解析的に求めることができる可能性がある。
夕食は、ルームメイトが用意した、おそらく電子レンジで温めただけの代物だったが、僕は研究に没頭していたため、味など全く気にならなかった。食事中も、頭の中ではE₈チャーン・サイモンズ理論のことがぐるぐると回っていた。特に、この理論が量子重力とどのように関係しているのか、という点が僕の最大の関心事だ。一部の物理学者は、チャーン・サイモンズ理論が3次元量子重力の有効理論として現れると考えている。もしそうなら、僕の研究は宇宙の根源に迫る手がかりとなるかもしれない。
夜になって、さらに驚くべき発見があった。僕が開発したアルゴリズムを適用した結果、E₈チャーン・サイモンズ理論における特定の結び目不変量が、数論における「モジュラー形式」と深い関係を持っている可能性が浮上してきたのだ。モジュラー形式は、数論の中でも最も美しい対象の一つであり、楕円曲線や保型形式と密接に関連している。もし僕の予想が正しければ、物理学と数学の間に全く新しい繋がりが見つかるかもしれない。
この発見は、僕を興奮で眠れなくさせた。しかし、興奮している場合ではない。この結果を厳密に証明し、論文にまとめなければならない。今日は一日中、その作業に取り掛かることにしよう。
(追伸)
ルームメイトが僕の部屋に勝手に入ってきて、「落ち着け、壁を叩くのはやめてくれ」と言ってきた。僕はただ、頭の中の数式を整理するために、リズム良く指を動かしていただけなのだが。全く、ルームメイトというのは理解に苦しむ存在だ。