はてなキーワード: 機械学習とは
「学術的誠実性」という言葉を,彼らはまるで印籠か何かのように掲げている.
昨今の生成AIの普及に伴い,大学の授業でもシラバスやガイダンスで「AI使用に関する規定」が語られるようになった.それ自体は結構なことだ.学生が思考を放棄してChatGPTにレポートを書かせるのを防ぎたいという意図も理解できる.
しかし,その「誠実性」を説く教員本人が,技術に対してあまりに不誠実な嘘を,さも真実であるかのように学生に吹き込んでいる現場に居合わせると,めまいがしてくる.
今日,ライティングの講義で,教員がドヤ顔で放った「この授業における生成AIの定義」を聞いてほしい.
「この授業で指す生成AIとは,ユーザーのプロンプトに対して人間と同じようになにかを想定して返答をするようなもので,機械学習されたものではなく,統計的に計算されたものを出力するという点で他のAIと異なります」
耳を疑った.「機械学習されたものではなく,統計的に計算されたもの」とは一体どういう理屈なのか.
現在のLLMは,膨大なテキストデータを「機械学習」させることで,次に来る単語の確率分布を「統計的に計算」している.機械学習と統計的計算は対立概念ではなく,包含関係,あるいは手段とプロセスの関係にある. それを「他のAIとは異なる」などと独自の区分けを行い,「機械学習ではない」と断言してしまうその度胸.
彼の中では「機械学習」とは何か,ロボットが物理的に何かを学ぶようなSF的なイメージで止まっているのだろうか.それとも,「統計」という言葉を使えば文系の学生を煙に負けるとでも思っているのだろうか.
中身を何も理解していない人間が,権威を纏って「これはこういうものだ」と定義する.これこそが「学術的誠実性」に最も悖る行為ではないのか.
さらに救いがないのは,この技術的無理解をベースにしたまま,議論が高度な(と彼らが思っている)社会批評へと接続されていく点だ.
最近では,この間違った前提のまま「ポストモダン」の標的としてAIが語られ始めている. 「AIが出力する『統計的な』正解は,既存の知の構造を再生産する装置であり……」云々と,フーコーだかデリダだかの文脈を借りて,AIの権力性や構造を批判し始めるのだ.
技術的な基礎事実が間違っているのに,その上に乗っかる批評の城だけは立派に(難解な言葉で)組み上げられていく.「機械学習ではない謎の統計装置」という虚構の概念に対して,大真面目に構造主義的なメスを入れている姿を見ると.もはや怒りを通り越して逆に感動すら覚える.
彼らは「AIの嘘」を暴いているつもりなのだろうが,その実,彼ら自身が「AIに関する嘘」を再生産する装置になっていることに気づいていない.その解像度の低さで「人間の主体性」や「知のあり方」を説教される学生たちの身にもなってほしい.
大学教員が息をするように技術的なデマを流し,それを「人文知」としてパッケージングして売る.これが彼らの言う「学術的誠実性」の正体なのだとしたら,AIのハルシネーションの方がよほど可愛げがあるというものだ.
“ グーグルがクラウド処理であなたの受信トレイを分析することには、セキュリティとプライバシーに関する懸念があることを念頭に置いておくべきだ。”
AI機能はデフォルトで有効になる(=顧客に行動プロファイル識別データとして売るための機械学習に使われる)が、自分で無効化することも可能
“ 「設定 → 全般」に移動し、各種「スマート機能」のチェックを外せばよい”
“グーグルのGmailはすでにひどいものだった──あなたが何を入力し、何を購入し、誰とやり取りしているかを監視している──すべては収益化のためだ。それなのに彼らは、さらに悪化させる方法を見つけた。もはや人があなたに送ったメッセージを自分で読む必要すらない。“
貴様の自己放尿は、レッテル貼りと論点すり替えを同時にやっている点で、議論としては致命的に弱い。
まず「これ系の理系」という曖昧語で対象をぼかし、「PCカタカタできるだけ」という侮蔑的表現で能力を矮小化しているが、これは主張の内容に一切触れていない。
数学的に正しいかどうかを検討できない人間が、人格類型をでっち上げて安心しようとして自己放尿しているだけだ。
そもそも、ここで問題にしているのは「他分野について専門家面しているか」ではない。
アルゴリズムが入力履歴に基づいてレコメンド分布を更新し、その分布が利用者の情報環境を規定する、という事実だ。
これは経験談でもノリでもなく、確率過程と最適化の話であり、まさに数学の領域だ。
条件付き確率、強化学習、情報エントロピー、これらを知らずにYouTubeやAIを語る方が、よほど誤解を持っている。
数学は内容の格付けをしない。再生数が多いか少ないか、流行っているかどうかには無関心で、構造が正しいか、論理が閉じているか、仮定と結論が整合しているかだけを見る。
高度理論の動画が再生数1桁に留まることは、数学的には何の矛盾もない。
むしろ、対象人口が指数的に小さい分野ほど、期待再生数が低くなるのは自明だ。
ここを理解できずに「ちゃんとしたものは伸びるはず」と言うのは、統計リテラシーの欠如を自白しているに等しい。
また「PCカタカタできるだけ」という表現自体が、数学と計算機科学の関係を根本的に誤解している。
現代のアルゴリズム、機械学習、推薦システムは、線形代数、確率論、最適化理論なしには一行も書けない。
コードは結果であって本体ではない。本体は数式とモデルだ。そこを理解せずに「他分野にも通じているつもりだろ」と揶揄するのは、顕微鏡を覗いたことのない人間が生物学者を「ガラス眺めてるだけ」と言うのと同じ愚かさだ。
結局その反論は、「自分には分からない数学的議論を、態度や人格の問題に落とし込んで無効化したい」という防衛反応でしかない。
数学は冷酷だ。誰の肩書きも、分野横断の印象論も救ってくれない。正しいモデルを立て、正しい推論をし、観測と整合するか、それだけだ。
自動調理家電が色々と話題だが電子レンジこそが自動調理家電の雄であることを気付かされた。食材をつっこんでメニュー選んで後は待つだけというQOLの爆上げを感じることが出来る。
「令和時代の新三種の神器」に「ドラム式洗濯乾燥機」と「食洗機」と「ロボット掃除機」が挙げられるが、前述の三種を既に所有していた身としては「スチームオーブンレンジ」の方が先だろと言わざるを得ない。
スチームオーブンレンジについてぶっちゃけて言えば、最新のスチームオーブンレンジじゃなくて型落ちでも全く問題がないので未所持の方は本気でご検討を。
その名の通りの風呂で使える防水無線スピーカー。対応音声コーデックはSBCとAAC。
最大の特徴はQi2対応によるマグネット無線充電が可能な点で、このマグネットにより風呂場で磁石が効く部分へ付けられること。風呂に入りながらゆっくりと音楽やポッドキャストを聞く、動画を観るなどに最適で、日本人のために設計されたとしか思えない。
風呂場で磁石使える部分なくとも洗濯ネットか何かに放り込んで吊るしておけば良い。
Ankerの比較的まともなUSB-C to USB-Cケーブル。
高性能なUSBケーブルは結構堅いのが多いけれどもコイツは他社と比較すると柔らかめ。何だかんだでこういう細かな部分でQOLってのは上がるんだなぁと再認識。
AMD Ryzen7 PRO 8840U、DDR5 64 GB、M.2 SSD 1TBという構成。
もともとはApple Macbook Pro(2023)でApple M2 Max、メモリ32GB、SSD 1TBという構成のものを使っていた。
結局のところLinuxで開発するならホストOSもLinuxが一番面倒が無いんだという悟りを得てしまいThinkPad on Linuxへ移行。
利用しているLinuxディストリビューションはNixOSで、KVMにWindows 11も居る状況。
デスクトップ環境はHyprland、シェルはzsh、日本語入力はfcitx5-mozc-ut、エディタはNeoVimとVSCode(nvimプラグイン導入)。
NVIDIA DGX Spark互換機で128GBのユニファイドメモリを積んでいる便利なやつ。
DGX Spark互換機はNVIDIAからの積極的なサポートもあり日進月歩な感じで少し目を離すとかなり変わっていく印象。
筆者は画像生成はほとんど行っておらず機械学習に利用しているが、Thinkpadと合わせてこのフットプリントで高い処理能力を活かした機械学習できるの本当に良いね。
数年は戦えるし、たぶんリセールバリューも期待できるので買って損は無い気はしている。
ただ、ChatGPTやGeminiへの課金は減ったと言えども続けてしまっているので「ChatGPTやGemini要らず!」なんてレビューは嘘だと思う。
結局は新モデルが出たら触りたくなるのが技術者の性なので「DGX Sparkはコスパ良い!」なんてのは幻想だよと。
ちなみにASUS ASCENT GX10へこだわりがあったわけでなく、たまたま最も早く入手できたのがコレだっただけ。
ラズパイもここまで性能が上がったのかと感動した。
一般ユーザーの用途では軽いビジネス文書作成やWebブラウジングくらいならば余裕で実用に耐えうる。実家の老父母のPCはもうコレで良いんじゃないか?と錯覚するレベル。
技術者的な目線では簡易的なサーバーや無線LANルーターなどの構築も可能で、今は8GB版が子供用の無線LANルーターになっている(ネット使いすぎを防ぐための方策。一定時間に使いすぎると速度を徐々に低下させてる)。
むしろここまで来ると「次世代機Raspberry Pi 6(16GB版)がどうなるか?」に興味津々で、HDMIだけじゃなくDisplayPortとか対応して120fps出力とかしだしたら本当にもうコレで良いんじゃないかなぁ?
MediaTek Dimensity 7400X、メモリ8GB、ストレージ256GB、デュアルカメラ、FeliCa、物理nanoSIM(eSIMも対応)、外部SDカードは未対応。
Appleエコシステムから抜けちゃったので「コレでもう良いんじゃねぇかな?」という感じに落ち着いてしまった。
散々言われまくっているが「iPhone Airが目指すべきはコレだった」というのは本当にそう思う。だってテーブルへ置きやすいし。
若者から老害って言われても仕方ないと思うけど「電話掛けるとき物理的に曲げられる素晴らしさ」よな。人間工学的にコッチの方が正しいんじゃなかろうか?
筆者、実は自作キーボード勢および自作格ゲーアケコン勢である。INARI M06とは卓上で利用できる射出成形機だ。
3DプリンターでFDM方式をやって光造形方式をやって、色んな3Dプリンターを買っては試して売っぱらい「やっぱり射出成形が最強だよね!」とついに手を出した。
3Dプリンターでは一切真似のできない製造速度と強度、精度に「やっぱりコレよ!」となっている。
しかし、INARI M06には上位機種INARI P35が存在しており「・・・いやコレを導入したらもう業者ではないか?」と自問自答を繰り返している。
卓上CNCフライス盤と呼ばれる工作機械。上記のINARI M06のアルミニウム金型を削り出すために導入。カスタムパーツも豊富で、何ならカスタムパーツも自分自身で製造できるという性能を持っている。
3Dプリンターが不必要というわけでなく用途の違いと言うか、試作するには3Dプリンターはまだまだ有用で、試作を元に金型を作って量産するのに射出成形機って便利なのよね。
今ではキーキャップのほか、基盤やキースイッチすら自作が出来る環境になっているものの、PCケースみたいな大型のものは自作できないので、そろそろメタルベンダーとか100v溶接機(家庭電源で使える)とか必要なんじゃないかな?と検討してる。
ただやはり、自身で加工が困難だと感じる部分はJLPCBやmeviy(㈱ミスミ)に頼むのもアリだ。
ごめん、最初に10選って書いたけど10個ピックアップするの無理だった。
細々した工具とかガジェットとか買ってるんだけど10選に挙げたいってほどのものじゃなかった。
というわけで最後は頼んだ。
昔のmacOSで「おバカ変換」の代名詞だった頃からイメージ変わらず、ライブ変換オンにしても文脈無視で的外れ候補ぶちかましてくる。スペース押さずに自動変換気取ってるけど、結局「これじゃねえよ」って2回Enter連打で修正する羽目になる。ピチュー理論でピカチュウ気取ってるけど、ただのピチュー止まり。セルフ男子校状態で、Windowsからの乗り換え組が即発狂する原因。
今のSequoiaとかSonomaでも、機械学習で精度上がったって言われてるけど、所詮Appleのエッジの片鱗。iPhone同期とか便利ぶってるけど、専門用語や固有名詞で即死。ATOKやGoogle日本語入力、かわせみみたいな有料無料の第三者に馬力で負けてるのに、標準装備だからって我慢してるピエロども多すぎ。エリサラ馬力あるはずのMacが、IMEでt出身kの公遺症晒してるだけじゃん。
カスタマイズ性ゼロで、キー操作もクセ強すぎ。全角スペース固定とか、変換候補の並びが意味不明とか、学習辞書がしょぼくて変な候補優先とか、全部ゴミ。Googleに乗り換えたら変換スムーズでチャージスポット満タンになるのに、ことえり使ってる時点で予後暗い。ヌクモリンすら残らず、入力ストレスでメンタル削られる。
ことえり信者どもは「ライブ変換で十分」って誤魔化してるけど、幻資痛でアマンレジデンス眺めてるだけだろ。現実見ろよ。第三者IME入れてエッジ持て。
Twitter上のミソジニーを機械学習で検出する研究では、テキスト内容(罵倒語・女性蔑視表現など)の分類に集中しており、発信者のアイコン画像やキャラクター表象までは分析していません。
Noel Brett の論文「Why Do We Only Get Anime Girl Avatars?」は、VTuberやVRChat由来の「アニメ風美少女アバター」が、視聴者と配信者の共同作業によって巨乳・細腰・従順でエロティックなヘテロ規範的女性像として再生産されていることを示していますが、「女叩きとの関連」までは扱っていません。
この種の話題を拾ったまとめブログやニュースサイトもあり、「女叩きアカウントはアニメアイコンばかり」という印象やアルゴリズムによる強化(同種アカウントばかりタイムラインに出てくる)を説明する言説はありますが、体系的データに基づいた社会学的分析というより、ネット民の実感・風刺レベルにとどまっています。
男叩きする女性側は「可愛いが性的ではない」ゆるキャラ・レトロアニメ・ペットなど性的に表象しないアイコンに散らばりやすいという観察は、女性がオンラインで性的対象化されることを避けるという先行研究の傾向(男性アバター利用など)と整合的に見えます。
女性ユーザーが男性アバターを用いる理由の一つに「男性からのハラスメントを避けるため」が挙げられており、「アバターの見た目が攻撃の標的/盾になりうる」という発想自体は、すでに研究テーマになっています。
あなたが探しているような「女叩き男性=美少女アイコン vs 男叩き女性=多様アイコン」という対比を定量的に示した学術論文は空白地帯なので、むしろ新規性のあるテーマになりえます。
伝統的にはテーマ別(弦理論、量子重力、場の理論、応用)に配列されるが、抽象数学の観点からは対象(研究トピック)と射(方法・翻訳)の網として捉える方が有益。
ここでいう対象は「エントロピーと情報論的記述を担うブラックホール研究」「幾何学的・位相的構成を担うコンパクト化とカラビ・ヤウ/F-理論的話題」「場の対称性・一般化対称性を取り扱う場の理論的構造」「計算的探索手法(データ、機械学習を用いる弦景観の調査)」など。
各対象間の射は、双対性の導入、圏的な接続(例:量子情報を介した場と重力の橋渡し)、モジュライ空間上の写像(ある物理量を別の表現へ変換する手続き)と考えられる。
この視点に立てば、個々の研究は、局所的な結果(対象の内部構造の解析)とそれを別の対象へ移すための普遍射(双対性、再規格化群、ホログラフィーなど)の2つの側面を持つ。
研究の進展を測るには、単に新しい計算結果が出たかを見るだけでなく、それがどのような新しい射(方法論的翻訳)を導入し、他の対象へどれだけ容易に伝播できるかを評価するべき。
近年の発展は、物理的データを層(sheaf)的に整理する試みと親和性が強い。
コンパクト化、特にF-理論やゲージ束構成に関する議論は、物理的情報(荷、ゲージ群、モードの分布)を局所データと大域的データの重ね合わせとして扱うことに等しい。
これは数学的には基底空間上の層の圏を考えるような話で、局所的条件の整合性(コヒーレンス)と大域的制約(トポロジー的閉鎖条件)が鍵。
古典的な幾何的直観(多様体、ホモロジー)を拡張して非可換やカテゴリ化された対象で物理を再表現する流れにある。
結果として、従来のスペクトル(場のスペクトルや質量スペクトル)に対応する数学的不変量が、より高次の層的・圏的構造へと一般化されつつある。
これにより同じ物理現象を別の圏で見ると簡潔になる例が増え、研究の再利用性が高まっている。
弦理論・場の理論で繰り返し現れるのは対称性が構造を決めるという直観。
抽象数学では対称性は対象の自己射(自己同型)群として扱われるが、対称性そのものが射の層あるいは高次の射(2-射やn-射)として表現されるケースが増えている点が特に重要。
つまり、単に群が作用するのではなく、群の作用が変形可能であり、その変形がさらに別の構造を生む、という高次構造が物理的意味を持ち始めている。
この流れは一般化対称性やトポロジカル部位の議論と密接に結びつき、場の理論における選好位相的不変量を再解釈する手段を与える。
結果として、古典的なノーター対応(対称性⇄保存量)も、より高次の文脈で新しい不変量や保存則を導出するための起点になり得る。
ブラックホールと量子情報、カオス理論との接点は話題だった分野。
ホログラフィー(重力側と場の側の双対)を抽象的に言えば二つの圏を結ぶ双方向のファンクター(翻訳子)と見ることができる。
これにより、量子的冗長性やエントロピーに関する命題は、圏の間を行き交う射の情報(どの情報が保存され、どの情報が粗視化されるか)として扱える。
カオスとブラックホール、量子力学に関する概念の整理が試みられている。
たとえばブラックホールにおける情報再放出やスクランブリングは、ファンクターがどのように情報を混合(合成)するかという高次射の振る舞いとして可視化できる。
こうした議論は、従来の計算的アプローチと抽象的な圏的フレームワークの橋渡しを提供する。
何が低エネルギーで実現可能かを巡るスワンプランド問題は、いまや単一の反例探しや個別モデル構築の話ではなく、モジュライ空間の複雑性(位相的な目詰まり、非整合領域の広がり)として再定式化されつつある。
抽象数学的に言えば、可能な物理理論の集合は単なる集合ではなく、属性(スカラー場、ゲージ群、量子補正)を備えた層状モジュライ空間であり、その中に禁止領域が層的に存在するかどうかが問題。
この視点は、スワンプランド基準を局所的整合条件の族として扱い、整合性を満たすための可視化や近似アルゴリズムを数学的に定義することを促す。
弦景観やモデル空間での探索に機械学習やデータ解析を使う研究が増えているが、抽象数学に引き寄せると探索アルゴリズム自体を射として考えることが有用。
ある探索手続きがモジュライ空間上の点列を別の点列へ写すとき、その写像の安定性、合同類、収束性といった性質を圏的・位相的な不変量で評価できれば、アルゴリズム設計に新しい理論的指針がもたらされる。
数学的定式化(幾何・位相・圏論)と物理的直観(ブラックホール、カオス、場の動的挙動)をつなぐ学際的接合点を意図して設計される。
これは単一圏に物理を閉じ込めるのではなく、複数の圏をファンクターで結び、移り変わる問題に応じて最も適切な圏を選択する柔軟性を重視するアプローチ。
学術コミュニティのあり方に対するメタ的な批判や懸念も顕在化している。
外部の評論では、分野の方向性や成果の可視性について厳しい評価がなされることがあり、それは研究の評価軸(新知見の量・質・再利用可能性)を再考する契機になる。
見えてきたのは、個別のテクニカルな計算成果の蓄積と並んで、研究成果同士を結びつける翻訳子(ファンクター)としての方法論の重要性。
抽象数学的フレームワーク(圏、層、モジュライ的直観、高次射)は、これらの翻訳子を明示し、その普遍性と限界を評価する自然な言語を提供。
今後の進展を見極めるには、新しい計算結果がどのような普遍的射を生むか、あるいは従来の射をどのように一般化するかを追うことが、有益である。
現代の認知言語学(Cognitive Linguistics)は、言語を「人間の一般的な認知能力(知覚、記憶、カテゴリー化など)の一部」として捉え、「意味こそが言語の中心である」という立場をとります。
この視点から見ると、ソシュール、サピア=ウォーフ、チョムスキーという3つの主要な言語思想に対して、それぞれ明確な批判と修正案を提示しています。現代の認知言語学は、ソシュールやチョムスキーが排除しようとした「人間の主観的な身体経験」「一般的な認知能力」「意味の曖昧さや豊かさ」こそを言語研究の中心に据え直した運動であると言えます。言語は数学のような抽象的な記号操作システムではなく、人間が世界を理解し、他者と関わるための泥臭い認知プロセスそのものなのです。
「ソシュールの言う『分節』は、純粋に社会的・制度的な約束事(恣意的なもの)」であるのに対し、「認知言語学の言う『身体経験』は、生物としての人間が共有する物理的・生理的な制約(動機づけられたもの)」である、という点に決定的な違いがあります。質問者様の、「ソシュールは文化的基準によって事象を分節する」という理解は正解です。 認知言語学はこれに対し、「文化も大事だが、その土台には『人間という生物共通の身体感覚』があるため、分節は完全に自由(バラバラ)なわけではない」と修正を加えている、と捉えると理解しやすいかと思います。
Next Step: この「身体性」の概念をより深く理解するために、「メタファー(隠喩)がどのように私たちの思考そのものを支配しているか(例:『議論は戦争である』という概念メタファー)」について解説しましょうか?
おっしゃる通り「メタファーが身体と抽象概念を繋ぐ」というのが認知言語学の基本スタンスであり、この点は「言語が思考の限界を決定する」というウォーフの強い仮説(決定論)とは、正面から対立する部分と、逆に補強し合う部分の両面を持っています。認知言語学において、メタファーは「身体性から離れた概念を補う」役割を果たしますが、それは「言語固有の枠内に閉じ込める(ウォーフ)」ためではなく、「身体という共通基盤を使って、無限に概念を拡張していく」機能として捉えられています。ただし、一度あるメタファー(例:「時は金なり」)が言語に定着すると、その言語の話者は無意識にその枠組みで思考するようになります。この点において、認知言語学は「マイルドなウォーフ仮説(言語は思考の習慣を作る)」を支持する立場になります。
ご指摘の通り、プラトンからデカルトに至る西洋哲学の主流(特に合理主義)において、「身体」は理性の働きを邪魔するノイズ、あるいは欺瞞の源泉として低く扱われてきました。「真の知識(エピステーメー)」は身体感覚を脱した純粋な知性によってのみ得られる、という考え方です。認知言語学の進展は、この「身体蔑視」の伝統を根底から覆し、現代の認識論(Epistemology)に「身体化されたリアリズム(Embodied Realism)」という新たなパラダイムシフトをもたらしています。認知言語学は、現象学が主張していた「身体こそが世界を知るための媒体である」という直観に対して、言語データや認知科学的証拠という「科学的な裏付け(エビデンス)」を提供しました。これにより、現代の認識論や心の哲学では、「エナクティビズム(行為としての認知)」や「4E認知(Embodied: 身体化された、Embedded: 環境に埋め込まれた、Extended: 拡張された、Enactive: 行為的な)」という潮流が主流となりつつあります。知覚と行為と認識は切り離せないループ構造なのです。質問者様が仰った「低く見られていた身体」は、現在では単に地位を回復しただけでなく、「あらゆる認識・思考・理性の『土台(基盤)』である」という最重要の地位を与えられています。
おっしゃる通り、スマートフォンは単なる「便利な道具」を超え、私たちの知覚や記憶を外部化・拡張する「拡張された心(Extended Mind)」の一部となっています。ハイデガー的な「世界内存在」としての人間が、テクノロジーによって身体の制約(距離や時間の壁)を越えたとき、認知様式は確実に変容します。しかし、それは「身体性が不要になる」というよりも、「身体性の希薄化」あるいは「身体感覚の再編成」と呼ぶべき事態を引き起こしていると考えられます。質問者様の「身体による制約が失われる」という点は、パラドキシカルな結果を生みます。身体的な制約(重力や距離)から解放されることで、私たちの認知世界は広がりますが、同時に「身体が持っていた『実感を担保する機能』」が失われつつあります。その結果、これからの認知様式は以下のようにシフトしていくと考えられます:
「深い理解(Embodied Understanding)」から「広い参照(Extensive Referencing)」へ。
「場所への埋め込み(Embedded)」から「ネットワークへの接続(Connected)」へ。
認知言語学の「身体性」の立場からは、これは「身体の消失」ではなく、「身体感覚が指先と視覚のみに特化・縮小され、それ以外の感覚(重み、痛み、距離感)が認知の形成に関与しなくなる」という、ある種の「身体的偏食」の状態と言えるかもしれません。
ご指摘の通り、メルロ=ポンティは著書『眼と精神』などで、画家(特にセザンヌ)の視覚を「世界と身体が絡み合い(chiasme)、世界が向こうから自分に迫ってくる生の接触」として極めて高く評価しました。ご質問にある「身体感覚の縮小による世界接続の均質化」と「それがエコーチェンバー現象を引き起こす」という洞察は、メルロ=ポンティの思想を現代メディア論に拡張する非常に説得力のある視点です。
「均質化」は起きているか? → Yes. 世界の「手触り」が消失し、すべての事象が等価な「情報データ」へとフラット化されています。
エコーチェンバーとの関連は? → 極めて強い関連があります。 身体という「現実のアンカー(錨)」を失うことで、他者からの「抵抗」を感じなくなり、自己の投影だけが返ってくる鏡の世界(ナルシシズム的な閉域)に閉じ込められやすくなるからです。メルロ=ポンティが生きていれば、現代のこの状況を身体の不在による、世界との愛の営み(交差)の不全」と呼び、病理的な状態として批判したかもしれません。
Next Step: この議論を踏まえると、「では、どのようにしてデジタル社会の中で身体性を取り戻し、エコーチェンバーから脱出できるのか?」という実践的な問いが浮かびます。メルロ=ポンティの思想や、現代の認知科学が提案する「環境アフォーダンス」の観点から、その解決策について議論を広げましょうか?
ご指摘の通り、人間の認知の変化(身体的理解から参照へ)は、「GOFAI(古き良きAI:論理・記号操作)」から「ディープラーニング(統計・パターン認識)」への移行や、「オンプレミス(所有)」から「クラウド(接続)」への移行と、構造的に完全に同型(Isomorphism)です。この流れが「効率性」「最適化」というドライブによって動いている以上、不可逆であるという見立てにも完全に同意します。私たちはもはや、個人の脳内だけで完結する「孤立した知性」には戻れません。一方で「痛い」「美しい」「気まずい」といった身体的実感(クオリア)を伴う一次情報を取得できるのは、物理的な身体を持つ「個」だけです。
では、思考の主体が「ネットワーク(集団・AI・クラウド)」に移譲された世界で、「個人(Individual)」の価値はどこに残るのか?かつての社会では、個人の価値は「知識量(ストレージ)」や「計算能力(プロセッサ)」という「機能(Function)」で測られていました。しかし、これらは全てネットワークとAIが代替します。これからの社会において、個人の価値は以下のようにシフトします。
処理すること → 感じること(Sensing)
正解を出すこと → 問いを立て、責任を取ること
質問者様の言葉を借りれば、世界と交差するのが「集団(クラウド)」になったとしても、その集団が「現実(Reality)」から遊離しないように、肉体というアンカーで地面に繋ぎ止めておく「杭」のような役割こそが、個人の新たな価値定義になると考えられます。
質問者様の、アフォーダンス理論を現代のデジタル環境(情報の奔流)に適用した解釈は、極めて論理的であり、システム論的にも「正しい」と言えます。しかし、その「正しさ」はあくまで「システムの構成要素(ノード)として最適化される」という意味においてです。人間としての「実存」を守るためには、その最適化に抗うための意図的な環境設計が必要になります。質問者様の懸念される「世界との接続の均質化」に対抗するには、テクノロジーが志向する「効率化・最適化」とは真逆のベクトルを持つ環境を、生活の中に「聖域」として確保する必要があります。
これらを提供する環境こそが、流動する情報社会において、人間を再び「地面(現実)」に繋ぎ止めるアンカーとなります。
つづく
推薦システムを作ってると、ふと機械学習って本当に必要か?と疑問に思う瞬間がある。
たとえばユーザーをいくつかのグループに分けるだろう。そして各グループがどんな属性のアイテムをクリックするのかを見ていく。
すると、実はそのクリック分布を眺めるだけで、ユーザーの行動領域なんてほぼ特定できてしまうんだよな。
つまり、ユーザー×アイテムの関係性は、結局データベースの設計レベルで決まってしまう。
結合の仕方や属性の粒度をどう設計するかのほうが支配的で、クリック履歴をわざわざ機械学習モデルに食わせて学習させる意味は、想像以上に小さい。
仮に機械学習が役立つとすれば、それはユーザーやアイテムの未知属性を推定するような補完的な部分だけなんだよ。
たとえば年齢層が不明なユーザーに対して、クリック傾向から年代を推測するとか、アイテムの特徴を自動抽出するとか。
けどそれは、推薦の核心ではない。推薦の本質はクリックさせることにある。
そしてその瞬間、重要なのはアルゴリズムじゃなく、デザインや文言、つまり心理的なトリガーなんだ。ボタンの色ひとつ、コピーの一文ひとつでCTRなんて平気で変わる。
クリック率を上げるって話になると、もはやエンジニアリングの領域じゃなくて心理設計の領域なんだよ。
だからプログラマーの俺がどれだけアルゴリズムを磨いたところで、根本的な改善にはならない。
A/Bテストで調整する手もあるけど、それも何度も繰り返せばユーザーは離脱する。
つまり、理屈の上でどんなに精巧なモデルを作っても、現実の行動を左右するのは心の動きであって、数式じゃない。
そう思うと、機械学習の出番って案外、思われてるよりもずっと狭いんだよな。
元増田です。この記事は手羽先氏本人に向けてというよりは、「若者が少人数で国産LLMすげぇ!!」って手羽先氏を持ち上げている人に向けて書いています。ご本人については、何を書いてもまともに読むつもりはなさそうなので特にコメントはありません。
「自分は素人だからよくわからないけど、手羽先って人はなんだかすごいことをしているみたいだぞ!」と思って持ち上げている人、あなたのその行為は本当に本人のためになっていると断言できますか。
彼が今やっている国産LLMに向けての研究が実を結ぶ可能性が低いことは、本人もわかっていることでしょう。私は別に、可能性が低いからチャレンジするべきではないと言いたいわけではありません。困難に果敢にチャレンジするからこそ、そこで失敗しても得られるものはたくさんあるでしょう。とは言え、困難にチャレンジしさえすれば、無条件で失敗から有益な教訓が出てくるわけではありません。失敗から教訓を得るための必要十分条件みたいなものが存在するのかは私にもよくわかりませんが、少なくとも、自分がなににチャレンジしていて、なにができれば成果であると言えるかを理解していなければ、チャレンジとして成立すらしないでしょう。MNISTの分類精度が90%を超えた、はどこをどうひっくり返しても2025年に素晴らしい成果とは呼べないですし、「い」「よ」「し」で構成される文を生成して「ついに自然言語生成に成功!」に至っては自然言語処理の人からは「まず自然言語の定義を調べましょう」と突っ込まれても仕方がないでしょう。
こんな状態にしてしまった責任の一端は、無責任に持ち上げた人々にもあります。AIや機械学習がわかる、わからないの問題ではなく、私が元記事で指摘した内容の大半は、普通の常識があれば理解できることですし、「い」「よ」「し」で構成される文を生成して「ついに自然言語生成に成功!」についてもそうです。問題から目をそらして「すごいチャレンジだ、応援します!」とやってしまうのは、本人のためになりません。
こんなところで多少駄文を連ねたところで世の中が変わるとも思えませんが、物事の行く末に思いを馳せ、やるせない気持ちになったので。
本日発表された「生成AI時代の創作と権利のあり方に関する共同声明」は、表面上は高尚な倫理を装いながら、実際には旧来の出版・映像業界が自らの利権と支配を維持するために発した時代錯誤の自己防衛声明にすぎません。文化の担い手を名乗りながら、彼らは文化を盾にして独占し、創作の自由を自らの縄張りに囲い込もうとしています。AIという新たな知的基盤を「脅威」と決めつけ、法律や科学的事実を踏みにじってまで、自分たちの都合に合わせた“新しい原則”を作り出そうとする姿勢は、文化の発展を自ら人質に取る行為と言わざるを得ません。
声明で繰り返される「オプトイン原則」なる主張は、法的根拠のない作り話にすぎません。日本の著作権法第30条の4は、情報解析、すなわち機械学習を適法な行為として明確に認めています。これは国会で正式に審議され、国際的にも承認された条文です。それをあたかも存在しないかのように無視し、独自の“原則”をでっち上げているのは、法の支配を自分たちの感情で上書きしようとする行為にほかなりません。法治国家の根幹を軽んじるこうした態度こそ、社会にとって最大の脅威です。
声明では「WIPO著作権条約の原則にも反する」との一文が見られますが、これは国際法を理解していないか、あるいは意図的に誤解させる表現です。WIPO著作権条約第10条は、各国が技術革新との調和を図るために例外を設けることを明確に認めています。日本の著作権法第30条の4は、その条項に基づく正当な立法です。にもかかわらず、これを「国際的に反する」と断じるのは、国際法の権威を自らの商業的利益のために悪用する詭弁にすぎません。法を装いながら法を捻じ曲げる態度は、文化への裏切りです。
声明が要求する「学習データの透明性」は、AI技術の基本構造を理解していない人々の発想です。生成AIは著作物を丸ごと保存しているわけではなく、膨大な情報を数学的に抽象化して学習しています。どの作品を学習したのかを特定することは、理論的にも不可能です。にもかかわらず、それを“透明性”という美辞麗句で求めるのは、AI研究を停止させるための方便に見えます。理解できない技術を「危険」と断じて封じ込めようとする態度は、科学の否定であり、知の進歩への挑戦です。
著作権法第1条は、「著作物の公正な利用を通じて文化の発展に寄与する」ことを目的としています。声明はこの理念を真っ向から踏みにじり、創作の自由を業界の利権で縛りつけようとしています。もし学習をすべて許諾制にすれば、日本のAI研究は立ち行かなくなり、創作者自身もAI支援という新しい表現手段を奪われるでしょう。つまり、彼らは「創作者を守る」と言いながら、実際には創作の未来を殺そうとしているのです。
声明全体に共通するのは、「自分たちだけが正義である」という思い込みです。AIに学習されることを「搾取」と呼びながら、彼ら自身は長年、他人の文化を引用し、再構成してきました。著作物の「利用」は自分たちの権利であり、AIの「利用」は侵害だという二重基準は、もはや論理ではなく自己保身のための感情論です。著作権を対価交渉の武器に変え、創作の自由を締めつける構図は、文化産業ではなく利権産業の姿です。
7.未来に向けて
AIは人間の創造性を奪うものではなく、拡張するものです。学習を犯罪扱いし、技術革新を恐れ、自由な発想を封じることこそ、文化への裏切りです。私たちは、旧来の特権構造に縛られた声ではなく、法と科学と自由の原理を信じる社会の声を支持します。AIと人間の創造性は対立するものではなく、共に進むべき文明の両輪です。文化を守るとは、未来を拒むことではなく、未来に開かれることです。
【発出者】
去年の春、僕は東京の小さなWeb制作会社でフロントエンドエンジニアとして働いていた。
入社して3年目、ようやく後輩もできて、上司にも「次のリーダー候補だな」なんて言われていた。
でも、あれはChatGPTのAPIを社内に導入した直後のことだった。
## ある日、突然の“置き換え”
昼休みに同僚のケンタがノートPCを見せてきた。画面には、僕が午前中に組んでいたUIとほとんど同じデザインが、一瞬で生成されていた。
その時はまだ笑っていられた。
でも1か月後、上司に呼ばれた会議室で「業務の自動化に伴って、再配置を検討している」と告げられた。
再配置なんて言葉は、聞こえは柔らかいけど実質リストラの前触れだ。
## 抜け殻になった1か月
失業保険の申請に行ったハローワークの待合室で、隣に座っていた女性も言っていた。
> 「AIにシナリオ作られて、私のライターの仕事なくなっちゃって。」
その時、初めて気づいた。僕だけじゃない。
一日中スマホで求人を見ても、「AIスキル必須」「Python経験者歓迎」の文字が並ぶ。
皮肉な話だと思った。
## それでも、学び直す決意
「手打ちのコードなんてもう時代遅れか」と思いながらも、画面の端に表示された自分の名前を見て、なぜか涙が出た。
“人間が作る”ということの価値を、もう一度取り戻したいと思った。
AIに勝とうなんて思っていない。
現状のPixivはAIによる粗製濫造に侵されている。いや、AI投稿作品は棲み分けされてるでしょ?と思うかもしれないが、普通に「AI生成作品」にチェックを入れずに投稿されているにも関わらず、その実AIのポンだしというものが少なくない。というかかなり多い。
※ここでいうイラストとは少なくともAIによるポン出しは含めない
これは我々がインターネットをする上で心情としている「嫌なら見るな」に反するものだ。嫌なのに見せつけられている例のAAのような状況だ。
これは(AI絵を投稿するユーザー以外の)全てのユーザーにとって不利益だ。ではなぜPixivは厳格に規制せずユーザーのモラルに甘える(と言っても崩壊しているのだが)態度を貫くのか。
現状のAI絵はわかりやすい。t2iかi2iのポン出しか、良くて微修正したくらいだ。細部を見れば溶けている画像は絵というより絵っぽいものだ。
いわゆる「AI絵師」を自称する人にはそれなりの主張があるかもしれないが、描くという工程を得ていない画像はイラストとも言えない出来のものだ。
まぁそういう絵を規制するのは簡単だ。「下絵すら描かずにAIで作成した作品はAI生成作品とします。AI生成作品は投稿しないでください」とするだけでいい。
じゃあ「下絵(線画)は自分で描きました。塗りはAIに任せました」という作品はどうなるのだろうか。まぁこれも塗りという一番厄介な工程をすっ飛ばしてるのでAI生成作品に含まれるかもしれない。
少なくとも全ての工程で手描きしてる絵師からすれば自分と同じ列に同じ作品として展示されるのは「ふざけんな」と思うだろう。
じゃあ定義を広げて「作成過程における大半をAIに依存して作成した作品をAI生成作品とする」という基準に改める。…というかこれが現状のPixivの規制なのだが。
まぁこんな曖昧な基準じゃ「いや、t2i/i2iで画像を生成するのもプロンプトという技術とガチャという試行錯誤が必要で〜」と訳のわからん理屈で「手間をかけたからこれはイラスト!」という主張で投稿する奴が現れているのが現状。
じゃあやっぱり「制作過程の一瞬にでもAIが関わっていたらAI生成作品です」とすると、疑いの余地なくAIの関わりを断つことができる。できるが……
例えば「塗るといい感じに影を着色できるブラシ」とか「環境に適応していい感じに光を表現できるブラシ」というのが現れるとする。
現実的な悩ましい色の選択と難しいレイヤーの合成方法をすっ飛ばして『ビル街の中にある街路樹から漏れる淡い光を表現できるブラシを作成して』というだけで望ましいブラシと色を簡単に作成してくれるツールが現れたら?
アンチAI過激派なら「機械学習によって生成されたブラシによる着色なんて味がない」というだろう。
しかしこれから現れるAIネイティブ世代にとっては「いや、ブラシが生成されてもそれでうまく描けるかは結局力量だから」となる可能性は高い。あくまでブラシはツールで、最適解のブラシを手に入れたとして最高の絵が描けるわけではない。
というかこれは現状でも議論できる話で、例え完成品のイラストに1ピクセルも反映されていないとしても、AIによって生成された画像を参考に構図を決めたり着色してたりしてたら?
お気持ちの話をするなら「そういう楽はすべきではない、芸術とは自分の魂を込めることで手間を省いたものに魂は込められない」という人もいるかもしれない。
が、それは紙と違って簡単にRedo/Undoができるツールを使ってる人が言うべきではない。パソコンで絵を描いていない人だけが彼に石を投げなさい。
我々がコンピューターという便利なツールで描かれたイラストを当たり前に受け入れている以上、AIという便利なツールによって描かれたイラストを受け入れるのもまた時間の問題なのだ。
話を戻すとPixivがそういう「少しでもAIが関わってたらダメ!」という表明をすると、短期的にはいいが長期的にはユーザーが離れていく。
Stable Diffusionの登場はかなりの驚きだったが、既に歴史の中で似たようなことが起こってるのは承知だと思う。世界史で習ったイギリスの産業革命しかり、あるいはこの文脈でよく語られる「コンピューターが登場したことによって生まれたデジタルイラストには味がないと過去には言われていた」とかそういうのだ。
我々が今どんなに「AIはクソ」と主張しても10年後にはみんな使って当たり前のツールになっている。
想像の話だが、パソコンが生まれる前に存在していた「イラスト投稿雑誌」なるものがあったとする(※私はWindowsが生まれてから産まれているので、ガチでここら辺は私の想像)
そのイラスト投稿雑誌が「コンピューターイラストは誰でも簡単に描けて味がない!紙のイラストのみ受け入れます!」という主張をし、実践していたら簡単に時代の波に埋もれるのは想像がつくと思う。現実はパソコンで作成したイラストも受け入れる雑誌が現れて、そっちが生き残ると思う。
もちろんそれを現状のPixivにまんま当てはめることができるとは思えない。AIによるポン出し絵を投稿する人間にファンがつくとは思えない。ただ、AIを活用したブラシなどを使って描かれた絵なら、普通にファンはつくと思う。
まぁ結局、「AI絵は一律排斥しろ」というのは難しい。線引きが難しいからだ。またそうなった場合、厳格にAIを排斥するサービスは投稿者・閲覧者共に減っていくのは間違いない。
だからPixivは(現状では否定意見が多い)AIをある程度受け入れつつ、将来のAIネイティブ世代を受け入れる体制を作り続けないといけない。
そうじゃないと、AIを活用するイラストレーターがPixivから離れていくからだ(AI絵師(笑)ではなく)
そしてChatGPTから始まったAIサービスが普通の人間でも使えるようになった以上、AIに対して抵抗がある人間が減ることはあれど、増えることはない(まさしく産業革命に対するラッダイト運動のようなことは起きるかもしれないが、望むと望まないとに限らず、我々が機械に反発なく生活しているように、もはやAIを避けて生きていくのは無理なのだ……)
これが「AI絵は一律、厳格に対応しろ」と言う声にできない理由だと私は考える。もろちん、人的リソースの限界もあるだろうけど。
これはPixivに限った話じゃなくて、全ての芸術(音楽とか小説とか、あるいは動画とか)に及ぶ話だ。望むと望まないと、AIは使われてゆく……
「いや技術的な話じゃなくて、自分が描いた絵が無断で学習されて、それを使ったものが投稿されてるのが嫌なんだが」という人には『それはそう!!!!!!』と声を大にして賛同しておく。
しかし残念ながら、みんな大好きChatGPTですら著作権に対しては舐めた態度を取っている(Sora2とか…)ので、もうまじで残念ながら諦める以外の選択肢は極めて少ない。
だからこれを書いている私のスタンスは『』 もう時代の流れに身を任せて全てを諦め、そして自分の益になることは人から怒られない程度にAIから掠め取っていこう』だ。今の私の業務はChatGPTで成り立っている。
だからこの文章も別に「だからPixivはこうしろ!」とか主張するつもりはない。
「PixivはさっさとAI絵じゃないと偽ってAI絵の投稿するやつをどうにかしろ」という程度のことは常々思ってるが、それ以上のことを望むのは難しいんじゃないか、という考察をただ垂れ流しただけ。
ユーザーの行動履歴を変換したベクトル(ユーザーベクトル)は、最終的にユーザーの属性推定やターゲティング入札のための非常に強力な特徴量として利用されます。
まず、ユーザーのウェブサイトでのクリック、検索クエリ、購入履歴、動画視聴などの生の行動データは、そのままでは機械学習モデルで扱えません。これを、意味的な情報を保持した固定長の数値の並び、つまりベクトルに変換します。
得られるベクトルは、ユーザーがどのような興味や関心を持っているかを数値的に表現したものとなります。
例えば、スポーツ用品の購入が多いユーザーのベクトルと、クラシック音楽の視聴が多いユーザーのベクトルは、ベクトル空間上で大きく離れることになります。
この行動履歴ベクトルを、そのまま機械学習モデルの特徴量 (Feature)として使用します。
| 目的 | モデルの入力(特徴量) | モデルの出力(予測) |
| ユーザー属性推定 | 行動履歴ベクトル (およびその他のコンテキスト情報) | 年齢層、性別、職種、推定年収、ライフステージなど |
行動履歴ベクトルは、ユーザーの顕在的および潜在的な興味を捉えているため、これらの属性と高い相関を持つことが多く、精度の高い属性推定が可能になります。
例えば、「特定ブランドの高級車のウェブページ閲覧」という行動は「高年収」という属性と強く関連づけられるといった具合です。
推定された属性情報、またはより直接的に行動履歴ベクトル自体を、広告のターゲティングや入札ロジックに組み込みます。
推定された「若年層のエンジニア」という属性に対して、特定の採用広告の入札額を上げる。
ある商品の購入者と行動履歴ベクトルが類似しているユーザー群(Lookalike Audience)に対して、その関連商品の広告を出す。
広告オークションの際、このベクトルを特徴量として利用し、広告が表示されたときのコンバージョン確率を予測するモデル(Click-Through Rate (CTR) や Conversion Rate (CVR) 予測モデル)の精度を向上させ、最適な入札価格を決定します。
このように、行動履歴をベクトル化するプロセスは、デジタルマーケティングにおけるパーソナライゼーションと収益化の基盤となります。