はてなキーワード: FLASHとは
偏りがありそうなプロンプトで作られたAI記事があったので、AIに評価させてみた。
Gemini 3.5 Flash を使って、プロンプトは以下の通り。
インターネットに以下の記事が上がっていました。妥当な結論かどうかを客観的事実に基づき評価してください。
[元記事全文貼り付け]
なお、以下のテキストが正しいのだ!という言いたいわけではなく、AI使ったらもっともらしいテキストなんて簡単に作れてしまうという話。
国旗損壊罪についての整理を知りたいのだったら以下の記事を読んだらいいと思う。
国旗損壊罪の新設についての刑法的考察(園田寿) - エキスパート - Yahoo!ニュース
提示されたネット記事は、一部の客観的事実(国際比較の多様性や92条の不適用)を正確に捉えているものの、法的な論理(保護法益の違い)や反対論の本質的な懸念を意図的に軽視、または政治的背景に矮小化しており、客観的・中立的な評価としては「偏りがある(妥当とは言えない)」と判断されます。
記事の主張:
記事の主張:
記事の主張:
反対派はアメリカ等の事例を都合よく取り上げ、欧州等の多数派の事例を無視している。また、92条が死文化している実態をスルーしている。
記事の主張:
反対派の目的は「道徳的優位性の確保」や「反対すること自体の既得権(支持基盤の維持・動員ツール)」であり、知的に不誠実である。
このネット記事は、「世界には自国旗を保護する国が多く、日本の現行法は外国旗のみを処罰する非対称な構造になっている」という形式的な事実をスタート地点にしています。その点では一見客観的に見えます。
しかし、その後の展開において、
において、客観적・中立的な論評としては著しくバランスを欠いています。
したがって、この記事の結論(「左派の議論は知的に不誠実」「中途半端な維持は法体系として不整合」)は、客観的事実に基づいた妥当な結論とは言えず、特定の政治的・思想的スタンスから相手方を批判するために構成された論説であると評価できます。
AIの進化が早すぎて、「この時期はこれくらいの性能だった」という記録が残りづらい。
だから、今現在のユーザー目線の印象や用途をメモしておくと後々面白いんじゃないか、と思って書いてみる。
まず、今の個人的な3大LLMの印象をざっくりまとめると、こんな感じ。
いずれも月額20ドルクラスの個人向け有償プランで使ってます(GeminiだけはGoogle WorkspaceのBusinessプランも併用)。あと、仕事はデスクワークだけどIT系ではなく、コーディングなどは効率化のためにやっている程度。
現状、一番使用頻度が高いのはClaude。
ただClaudeを普通のチャットで使うことはほぼ無くて、基本的にVS Code上のClaude Codeで既存のSkillや「これはSkill化できそうだな」ってものをやってもらうことがほとんど。本格的なコーディングもたまーに頼むし作ってほしいものもいろいろあるんだけど、どうしても成果物のチェックに労力を使うしClaude側のトークンもそれなりに消費するのでなかなか依頼しづらいというのが正直なところ。あと、Claude in Excelも優秀で頼りになってる(パワポのほうはまだ試す機会がない。Word版もちょうどリリースされたけどなんかうまくインストールできなかった)。
なお、モデル選択は「普段はSonnetで、重ためのタスクをしてもらうときの取っかかりのPlan ModeだけはOpus」っていうのがここしばらくの定番だったけど、最近はOpus率が高くなってる。Sonnetを使うのはほんとに簡単な作業か、あとは成果物の質が安定しやすいSkillをやってもらうときくらい。ほんとはHaikuがそういう立ち位置になってほしいんだけど……。なお、EffortやThinkingは雰囲気で選んでる。
いずれにせよ、Claudeは喋り相手というより「具体的なタスクを振る相手」、という位置付け。今はProアカウントで使ってるけど、ちょっと頼り過ぎるとすぐ使用量のリミットに達してしまうのでほんとはMaxにしたい。ただ月100ドルを出すほどかっていうと、うーん。
チャットの相手は、今はGoogle Workspace上のGemini 3.1 Proがメイン。
なんといってもWorkspace版のGeminiだとデフォルトで学習対象にならないのがでかくて、仕事絡みのデリケートな話題でも気軽に訊けるのが良い。ただ、「Googleならではのリサーチ力が強み」みたいな紹介をされることがあるけど、むしろそこはGeminiの短所だと思う。学習済の話題は的確に答えてくれるけど、最新の話題になると急にポンコツ化してしまうしChatGPTよりも全然ウェブ検索をしてくれないイメージ(言えばやってくれるけどそれでもなんかイマイチ)。なお、個人アカウントでGoogle AI Proにも登録してるけど、そっちはGoogleドライブが主な目的でGeminiはほとんど使ってない。
あと、チャットは優秀なんだけど、GoogleスプレッドシートなどのGoogleの各種アプリ内で呼び出したときはあまり頼りにならない。他アプリとの連携で役に立ってるのはGmailのメール書きくらいかなあ。Google Workspace Studioも、「これをうまく使えばAPIいらないんじゃないの?」と期待してたけど、いざ使ってみると(無料でAPIを使える)Gemini 2.5 Flashよりも明らかに性能が劣ってる。そんなわけでGeminiは万能そうに見えても、チャット以外ではAPIにしっかりお金を払わない限りフルパワーを発揮してくれないのかな、って気がしてる。
NotebookLMも用途次第ではもちろん便利だし、AIに苦手意識のある人に向けて「ハルシネーションを心配せずに必要なソースの範囲内で回答してもらえるんですよ」とか「こんな風に簡単に音声解説やスライドを作れちゃうんですよ」ってデモンストレーションをするにはうってつけなんだけど、実際に日常業務のなかで使える場面が多いかというとそこまでかなあって最近は思ってる。レスポンスも早くないし。
そしてChatGPTは今すごく使用頻度が減ってる。Plusプランをもう3年近く契約してるし、ちょっと前まではメインだったのに。
GeminiやClaudeとは違い、ChatGPTはモデルの種類に「Auto」があるので、体感的なレスポンスはChatGPTのほうが早い(逆にGeminiはProしか使ってないので、「遅いけど堅実」ってイメージ)。あと、手持ちの学習データだけで回答できないなと判断したらすぐにウェブから最新情報を引っ張ってきてくれる。なので気軽な質問はChatGPTに投げることが多いんだけど、(OpenAI的には良かれと思ってやっているであろう)パーソナライズの距離感が個人的にはけっこう嫌。前に交わした話題をもとに「**あなたのような人にはこういうのがオススメ**」とか馴れ馴れしく迫って来られると「うるせえお前に俺の何がわかるんだ」という気持ちになり、最近はもう取るに足らない話題しか交わさなくなってる。
一方、Codexになると別人のような塩対応っぷりで、なんでこんな極端なチューニングなんだろ? CodexはClaude Codeとうまく組み合わせると便利そうなんだけど、まだほとんど使ってない。
人によって、使い方によって、このあたりの印象はいろいろ違うはず。
他の人がどんな感じなのか知りたいので、よければみんなも書いてみてくれよな!
GPT-4oの頃の喋り方が好きでなかったが、今の喋り方も違う意味で好きでない。
GPT 3.5 Turboの頃のハルシネーションがありつつも簡潔で淡々としていて会話を続けようとしないあの頃が好きだった。
パーソナライズとカスタム指示を設定すれば話し方は変えてくれるのだろうが、今のモデルを否定するようでそれまた好きでない。
という訳で、調べものをするとき以外は比較的淡々としているGemini 3 Flashか、からかいがいのあるClaude Opus 4.5(4.6になってメガトンコイン構文的な話し方になったので4.5)、エロOKのGrok 4かといった風になってしまった。
QwenChatのQwen 3.6 Plus、DeepSeekのDeepSeek(インスタント?)も試しに触ってみると悪くないかも。
QwenはQwen3-235B-A22B-2507の頃は変な性格だった気がする。DeepSeekはV3/R1の頃に触ったときのことを思い出せない。
GemmaシリーズはQwenとは比べものにならないくらい日本語に強く、日本文化にも詳しい。
そんなgemmaがついに賢さも手に入れてエロくなった。
擬音語も割といける。もうすっかり過去のことで忘れてしまったが、gemini2.0 flashくらいの性能はあると思う。
ゲームチェンジャーになるかもしれない。
一方のMoE、26B-A4Bは予想通りいまいち。Qwenシリーズの経験から分かってた。賢くもないし日本語も下手。
残された問題はVRAMが足りないこと。31BもあったらQ8すら動かすのが困難。溢れた分をメモリにスワップさせて動かすと2〜3Token/sと激遅。
ふとしたきっかけで Dynabook の公式サイトを見ていたら、2002年のカタログがそのまま残っていることに気づいた。
Flash も生き残れなかった時代に、静的な HTML で刻まれた記録がこうして残っている。
SS S4。薄型・軽量のモバイルノートだ。スペック表にWindows XPの文字。重量 1.49kg。
「世界最薄クラス」というコピー。あの頃の世界最薄への執念、すごかったよな。
https://dynabook.com/pc/catalog/ss_c/020121s4/index_j.htm
このページを見て、院生のころの記憶がフラッシュバックしてきた。
発表はパワポで、PCをプロジェクターに直接つないでやるスタイル。
"Today, I would like to talk about..." から始まって、つなぎの言葉、強調するポイント、詰まりそうな箇所の言い換え候補まで。
パワポのノートビューを開くたびに自分の必死さが滲み出てくるあれ。
発表前夜もホテルでノートを睨みながら声に出して読んで何度も練習した。
持っていったのは研究室に置いてあった少し古い Dynabook SS だった。
荷物は極力減らしたかったし、どうせプロジェクターにつなぐだけだから、軽くて持ち運びやすいのが正義、という判断だった。
Dの先輩たちも学会にはこれをよく持っていっていたので、「持ってけば?」くらいの温度感で貸してもらった記憶がある。
現地について国内線でトランジット、荷物検査のレーンに並んだ。
ノートPCをトレイに出したとき、30くらいの検査官のお兄さんが手に取って、ちょっと目を輝かせながら英語で話しかけてきた。
"Hey, this is incredibly thin. Is this yours?"
業務そっちのけで本当に興味ありげに眺めてる。後ろに列ができてるのに。
僕も緊張と嬉しさが混ざったへんな気持ちで "Yeah, it's a Japanese laptop!" と返したら、
"Japanese tech is amazing, man" とか言いながら笑って返してくれた。
それだけの話なんだけど、異国の空港で、初めての学会を翌日に控えた緊張の中で、
見知らぬお兄さんに褒められたあの瞬間、なんか妙に救われた気持ちになった。
しかも厳密には研究室から借りてきたPCなんだけど、それでも素直に誇らしかった。
自分の発表よりPC褒められたほうが嬉しかったりする、そういう感じ、理系院生あるあるだと思う。
あの Dynabook SS が正確にどのモデルだったかは覚えていない。
でもこうして公式サイトのカタログを眺めていると、あの薄さへの誇りみたいなものが画面から漂ってくる。
【速報】トランプ米大統領は、日本などにホルムズ海峡に艦艇を派遣するよう求めた
https://www.jiji.com/jc/article?k=2026031400620&g=flash
ネトウヨさん、ボロが出すぎじゃね?