はてなキーワード: メルマガとは
きっかけは、学生時代にちょっとしたレポートでテキストの単語出現頻度を数えようとしたとき、「あれ、そもそも日本語ってどうやって単語に分けんの?」って疑問が出たところからだ。
英語ならスペースで切れるけど、日本語はそうはいかない。で、いろいろ調べて「形態素解析」って言葉にたどり着いた。
その瞬間にちょっとハマったんだよね。
辞書をもとに文を機械的に切り刻んで、品詞をラベル付けして、統計を取って、構文を推定する。まるで人間の頭の中を数理的に覗いているようで。
そこからMeCabとかJumanとかKyTeaとか、いろんなツールを触った。
Pythonでテキスト処理のパイプラインを組んだり、mecab-ipadic-NEologdを突っ込んで新語に対応させたり。
「言葉を数理で扱える」って発見が、ちょっとした中毒になった。
その頃はMosesとかGIZA++とか、ああいう統計翻訳系のツールも触ってたね。
単語アラインメントの確率モデルをいじって、「確率的に対訳辞書を作る」みたいな遊びをしてた。
とにかく、NLPの世界には「人間の言葉を数学で再現できるかもしれない」という変な魅力があった。
深層学習がまだ主流じゃなかったから、n-gramやHMM、CRFなんかが主戦場で、論文読むたびに確率式の展開を手で追ってた。
最初はPoC(Proof of Concept)しかやらせてもらえなかった。
感情分析とか、Stance Detectionとか、「この文は文法的に典型か非典型か」を判別するための言語モデルの構築とか、エンティティリンキング、質問応答(Question Answering)。とにかくNLPの典型的なタスクを一通り。
学術的には面白かったけど、現場で求められてたのは「論文再現じゃなくて、実用的な精度と速度」だった。
PoCで終わって、実装には至らない案件が山のように積み上がっていった。
あの時期、NLP業界全体が「技術的にはすごいけどビジネスには落とし込めてない」って空気だった。
でもさ、LLM(大規模言語モデル)が出てきてから、世界がひっくり返った。
正直、最初は「Transformerの延長だろ」と思ってたけど、数ヶ月で実感が変わった。
それまでチマチマ特徴量を設計して、分類器を学習して、F値を0.02上げるために夜中までパラメータをいじってたのが、全部一瞬で過去になった。
ChatGPTが出て、蒸留やファインチューニングでほとんどのNLPタスクが置き換えられるようになったとき、「あれ、今までの俺の知識、ほとんど無駄だったんじゃね?」って一瞬マジで虚無になった。
でも、そこで終わらなかった。プロダクション環境を任せてもらえるようになって、推薦システムとかパーソナライゼーションの設計をやるようになって、ようやく「ユーザーベクトルを使う」という文脈でNLPが再接続した。
単なるテキスト処理から、「テキストを媒介にして人間の行動を理解する」方向に進んだ。
埋め込み表現をベースにユーザーの嗜好を推定して、レコメンドやメルマガのパーソナライズをやる。
自然言語はもう目的じゃなくて、インターフェイスになった。そうやって初めて、「NLPがビジネスに食い込む瞬間」ってのを肌で感じた。
PoCなんてやってても金にはならん。動くシステム、回る仕組み、再現性のある成果、それを出せないと、どんなに学問的に立派でも意味がない。
---
T・H:Hello, Youtube. Hエモンこと、T・Hです。
Y・T:みなさん、こんばんわ。アシスタント役のY・Tです。いやー、Hエモンさん、今日暑くないですか?もう夏バテしそうです〜。
T・H:暑いよ。てかさ、今日移動中にウーバーの運ちゃんが「AIで仕事なくなるんすよね」って言ってきてさ。
Y・T:えっ、そんな話になるんですか(笑)Hエモンってバレなかったんですか?
T・H:いや、バレてたんじゃない。でもさー、最近そういう話題多いじゃん。AIとかユニコーンとかさ、意味わかんないわけ。
Y・T:で、今日取り上げるのが「バイブコーディング」。バイブ……?なんだか響きがちょっと(笑)
T・H:いやいや、そうじゃなくてさ、てか、T田さんそういうのありなの?
Y・T:いやいやいや、ちょっとね。確認だけ、色々あるじゃないですか(笑)
T・H:ないよ。で、話戻すけどさ、バイブコーディングってのは自然言語でコード書くみたいな手法で、それを「知らなきゃ失業」って煽ってる記事が出ててさ、マジで何ゆってんの、こいつ、みたいな。
Y・T:あー、例のIさんのやつです、、、かね?炎上覚悟だけど、ん?みたいな。
---
T・H:まずさ、主張が雑なわけ。「知らないとホワイトカラー全滅」って、なにゆってんの、こいつ。
Y・T:AIが進化してるのは確かですけど、全部バイブコーディングだけって……。ホントかな、みたいな。
T・H:根拠ゼロよ。「社員の大半が知らない」って、どこの話よ。統計もないし体感レベルじゃん。
Y・T:断言されると、そうなのかなって思っちゃうんですけど、、、んと、違うんですか?(笑)
T・H:ぜんっぜん違うから!で、途中から「サロンに入れば全部教えます」って話とか、アムウェイじゃん。
Y・T:あー、最初は「AIすごいですよ!」だったのに、気がつくとオンラインサロンの宣伝になるってありがち、かも?ですね。
T・H:おまえ、自分のサービス誘導したいだけだろ?っつー話。
---
T・H:あとさ、こいつ実績ないじゃん。いや、ないわけじゃないけどさ、結局、おまえ何作ったの?どこで運用されたの?って話。
Y・T:そうですね、Iさんが何か作ったかっていうと、、、んー、って感じかなー?
T・H:そういうやつに限って「これからはこうしなきゃダメ」って言い切るんだよ。俺もだけどさ(笑)
Y・T:、、うーん、それはちょっとわからないですけどねー(笑)。Hさんの意見としては、そうだ、と。
T・H:、、、何、T田さんはIさんからなんかもらってんの?
Y・T:いやいやいや(笑)、ないですよー、そんなのないですよー。アイドルですよー。
---
T・H:でさ、「小学生でもできる」って言ってるけど、実際の業務で使うとなるとめっちゃめちゃ大変だから。LDでどんだけ大変だったか。
Y・T:セキュリティとか、業務知識、サーバー負荷とか、イテレーションとか、そーゆのですかね。
T・H:そうそう、動くだけなら誰でもできるけど、“使える”ってのは全然別なわけよ。マジでなんもわかってない。俺もだけどさ(笑)
---
Y・T:あと、分析でも出てましたけど、「本当に革命的なら、なんでサロンで囲うんですか?」っていうのがありましたよね。
T・H:それよ。ほんとにスゴいなら無料で配れよ、あと、お前も抜かれる運命にあんぞ、って話。囲ってる時点で「中身ありません」って言ってるようなもんじゃん?俺も囲ってるけどさ、努力はしてるよ。どんだけ働いてると思ってんだよ。
Y・T:Hさん、めっちゃ働いていますもんね。それと比べると、、、中身がちょっとってとこですかね。
T・H:いや、だって、事実じゃん。仕事をなくすのはお前もだぞ、って話。
---
T・H:でさ、ステルスフォールバックって、難しいけど、簡単にいうとChatGPTとかで知らん間に性能下がってるってことなのよ。
Y・T:あー、でも、私も思いました。なんか最近話が軽くて、対話モデルも、文脈保持も甘い。Redditでも話題になってますよね。
T・H:こんな不安定な技術をベースに「革命」語ってんの、やばくない?これ買わされた人どんだけ無駄な時間とお金を遣わされるのよ。
T・H:当たり前じゃん。どんだけ俺がメルマガに時間かけてると思ってんだよ。ただ、適当に喋ってるだけだけどさー。それだって簡単じゃないんだよ。
---
T・H:まとめると、「大げさな主張」「根拠なし」「サロン誘導」「実績なし」「技術理解ゼロ」「信頼性スルー」。情弱マーケのテンプレ完成系。以上。
Y・T:以上です(笑)。
Y・T:でも、私も、こういう話ってひっかかちゃいます(笑)。食べるだけダイエットとか。
T・H:だから言ってんのよ。情弱ビジネスとかさ、俺のメルマガ登録しろって。大した内容じゃないけど、こいつよりは頑張ってっから。
Y・T:今後、こういう「革命」をうたう情報に触れたら、一度立ち止まって「で、この人何やったの?」っていうことですかね。
T・H:てか、もうつかれたわ。なんで、俺が自虐しないといけないんだよ。まぁ、いいけどさ。
Y・T:私は何もいってないですよー、あくまでHさんがゆっただけですからねー。
T・H:あー、てか、もう疲れたわ。だるっ。じゃ、そんな感じでIのバイブコーディングサロンについての話でした。いってらっしゃいっ。
Y・T:いってらっしゃーい。
1行要約;自動車対自転車の事故の約9割は自動車側のほうがより悪質だったと認定されている。そんななか自転車だけが悪いと嘘を流し読者を騙す詐欺広告を流すJA共済。利口な者はそんなJA共済を信用しない。
ツーキニストの疋田智さんが自身のメルマガで広告のウソにかみついている。本当の事を知らなければならない。
☆
━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓
┏━┫ 週刊 自転車ツーキニスト "Weekly Bicycle Tourkinist" ┣━┓
┃ ┗┳━━━━━━━━━━━━━━━━━━━━━━━━━━┳┛ ┃
┗━━┛ ┗━━┛
4月6日付の全国のブロック紙、地方紙に、こんな広告が載った(私が確認したのは『東京新聞』東京版朝刊)。
http://or2.mobi/index.php?mode=image&file=53841.jpg
JA共済のイメージ広告ともいえるものなんじゃが、いやはや、すごいなぁ。
「知ってるかな。自転車事故の2/3は、自転車側の違反なんです。」
だそうな。
これ、どう見たって、自転車事故の3分の2は、自転車に非があるように受け取れますよね。
知ってましたか? 私は知らんかった。たぶん知る人はほぼゼロだと思う。
ヘッドコピーの後に、小さな文字で「※警察庁統計データによる」とあるけれど、これいったいどういうデータなんだろう。
上記↑の資料の2ページ目、たしかに事故自転車の2/3に法例違反があるということが書いてある。統計上それは事実だ。警察庁の言葉では「自転車乗用中の死傷者の3分の2に何らかの法例違反」。
ただ、それは「自転車側が悪い」ということを指しているわけじゃない。
あらゆる自転車事故は「あちらが悪い、こちらが悪い」と軽々に決めつけられるものではなく、双方に法例違反があり、双方に過失がある場合の方が多いわけだ。つまり2/3の事故自転車に法例違反があるのと同時に、クルマ側にも(歩行者側にも)法例違反がある場合が多々あるというわけ。
中でも、今回の警察庁資料にあげられた「自転車側の違反」については、過半数が「安全運転義務違反」つまり、ハンドル操作不適、安全不確認、前方不注意、動静不注視などを指していて、そういう事故の場合、ほとんど、それ以上の過失がクルマ側に認められているのだ。
では、そうした状況の中、自転車が「一番悪い」と認定されたのは、どのくらいの割合なのだろうか。
つまり「自転車が第一当事者」の事故のことなんだけど、警察庁の資料によると、これが15.4%(「交通統計平成23年版」(警察庁交通局)平成24年7月発行)。
6分の1弱だ。