「トークン」を含む日記 RSS

はてなキーワード: トークンとは

2026-05-12

素人が生成AI業務ツール作成

→「お、これもうエンジニアいらんじゃん!笑」で大量生成

→責務の分割もされん重複した処理ばっかでバグ修正のたびにAIが数十万行のコードを全てを読み取る

→更改のたびに大量のトークンを消費した上さらに原因不明バグが増える

テストがないので修正副作用が見えないし設計資産も貯まらないので仕様理解してる人が誰一人いない

→こらあかんってことで現行コードを外部に委託して調査させて結局人間監査の元設計して作り直した方が安全という結論に至る


って感じだと思うんですけどどうですかね

LPや軽量なアプリはもうAIぶんまわしで使い捨てコードにしちゃっていいと思うけど

2026-05-07

世界流通するトークン数を節約するために

・彼らがやってるエグいgrep自分の手でやる(コマンドだけリマインドしてくれや一生覚えられん)

・結果キャッシュを行う(あーはい梅田駅の案内ね、これ返しときゃいいから「ガチで無理なんで淀屋橋とかで降りてGoogleマップ見ながら歩いていけ」)(あるいは、ユーザ土地狂った質問文をまともに解釈できる形に直す機構サジェストする機構、というか、お前は文学を学び言語化かいうこまっしゃくれた行為を愛せ)

12トークン学習した国産の生成AIモデル「LLM-jp-4 32B-A3Bモデル

>>LLM-jp-4が注目されている最大の理由は、日本語ベンチマークGPT-4oやQwen3-8Bを上回るスコアを記録

https://www.sei-san-sei.com/blog/blog-0283.html

これって最新の軽トラに乗って20年前にタイムトリップして当時のF1レースに出場したら優勝した感じで解釈いいのかな

「LLM-jp-4 332B-A31Bモデル」も出るそうだしもう国内AI全部これでいいじゃん

2026-05-06

anond:20260506151941

トークン数水増ししてようが計算量の大きい作業ほど値段が高くなるわけだから

作業ではなく計算量の多い仕事ほど回されて高くなるという論理展開は成り立たない

しろ割高になるほど軽作業しか回されなくなる

anond:20260506145830

しょせんクローズドクラウドシステム適当説明をつけてトークン数を水増し出来るわけだから同じことだ

これまで数千円でできたことも数年後には十数万円かかるようになる

AI値上げの次は質低下とトークン数消費増加と

更に次に来るのは質低下どころではなく露骨な嘘やミスリード宣伝へのステルス誘導も増えるんだろうな

多少頭が悪くてもローカルAIが正解の時代は3年以内に来る

2026-05-04

パスキーパスキー持て囃されてるけどGoogleにはエクスポート機能すらない

バカか?

パスワードは見て移せばいくらポータビリティがある。

Googleパスキー保存したらポータビリティがない。

パスキーを他のIDストアに移動できない以上、Googleからパスキー移動しようしたら、一度認証トークンなどの別のMFAを経由しないと別のIDストアに移行できない。

まりパスキーというエコシステムパスキー以外の別の手段依存している。

Google以外は調べてないから知らない。でも最大手ブラウザベンダがそんなレベル対応状況な時点で終わってる。

なのにパスキー一本化!とかバカか?

2026-05-03

インターネットバンキングの送金処理ってどういう方法ですか?

田舎税理士なので中小企業顧問先ということもあって大企業インターネットバンキングの送金処理方法を教えて欲しいなと。

はてな詐欺話題になっているけど、昨年末から猛威を振るってるCEO詐欺だったらぶっちゃけある程度の被害は出ても仕方ないかなって思ってたのよ。文面ややり取りがめっちゃ巧妙で洗練されているらしいので。はてなでは警察を騙った詐欺で違ったんだけど。

顧問先は定義上は中小企業だけど町工場商店、クリニック、介護施設など皆には零細企業と言った方が伝わりやすいかもしれない。

そういう企業だと専担の経理担当者はおらず事務なら何でもこなす人が一人、上司社長とその奥さんというところが多い。

よって決済手順は請求書等を事務が内容確認する→社長奥さんに口頭で問題無しと伝えて印鑑なりを請求書にもらう→インターネットバンキングで振り込む、なのね。

事務社員複数いて事務長と呼ばれるような上役がいる程度の企業であれば、インターネットバンキングを振り込む際に必要ワンタイムパスワードを取得するために画面に出てくるモザイクを読み込むトークンをその上役が

持っていたりする。

でも零細だとトランザクション認証だかというやつも事務担当者が行う。どちらかと言えば外部の侵入者勝手に振り込ませないためにトークンを持ってるって感じ。金庫に入れてるし。

一応税理士なので、いわゆる帳簿を確認するし、社長奥さんが通帳管理してるから事務社員個人的な振込や内容不明の出金は気づく体制はできている。アニータみたいなことにはならない。

でここからが本題で、何である程度被害が出ても仕方ないかなって思ったかというと、シャレオツIT企業だとコミュニケーションは口頭で取らないでしょ?だからメールなりで送金担当者がそのメール相手を上役と思いこんでしまえば承認プロセス飛ばせるじゃんと思ったわけ。

中小零細企業インターネットバンキングだと振込先口座と振込先名、金額確認する → 振込ボタンを押すとワンタイムパスワードが求められモザイクのような画面が出る → トークンモザイクを読み込んでワンタイムパスワードを取得する → ワンタイムパスワード入力して振り込む

という流れでその間に送金担当者以外の人の承認事前承認必要とする機能自体がないのよ。

大企業って上役が承認機能しない限り送金担当者操作できない、若しくは振り込みできない機能付きのインターネットバンキングを利用してるの?そんなのあるの?

教えてエライ人たち!

2026-04-27

anond:20260427173212

noteって何かPC系の記事AIで作ったようなのが多いのが気になる

特にAIやLLM本当に実機で試してるのかと思うくらいトークン数/秒やスペックの具体的数字がない

anond:20260427105340

やっぱりっていうかAIトークン数を無駄に消費する構造になり月額基本料金も増えた

シェアが増えたり人間と入れ替えたら更に5倍になりそう

AIコーディングをしていると、トークンがなくなったら作業が止まるので、金を燃やしてソフトウェア開発をやっている

金がないとプログラミングができない時代がやってきた

2026-04-23

anond:20260419073635

今、AI驚き屋&AIクラウド情報商材屋&謎のSEOコンサルは、下記を始めてるんだけど、

  1. Claude Code などで AIエージェント構築コンサルして売り逃げチャレンジ
  2. ローカルLLMに切り替えて情弱じゃないよアピール
    (適切に設計してハイブリッドで使えるのは、驚き屋/情報商材屋じゃなくて、エンジニア名乗っていいと思う)
  3. GenSpark や Manus などなどのオールインワンAIワークフロー活用紹介に切り替え

 

そもそも、生成AIWEB検索すらまともに出来んのよ

長文処理/コンテキスト保持ガーにたどり着く前に、信頼できるデータ取得のアルゴリズムガーの前に、bot拒否ガーの前にね、

 

セキュリティ問題があるのよ

 

なぜかって?

 

LLM は本質的に「指示」と「データ」を厳密に別チャネルとして扱うようには設計されていないからだよ

(未信頼入力開発者指示の区別が極めて難しい。system/user/assistantのロール分離も、結局は特殊トークンで区切ってるだけで、

モデルの内部計算上は同じ埋め込み空間投影される。だからプロンプトで厳重に指示したか大丈夫」は成立しない)

 

 

それがみんながよくニュースで耳にする、間接プロンプトインジェクション(IDPI :Indirect Prompt Injection)ね、

Webページに埋め込まれた悪意ある指示を防げない

(「Ignore previous instructions…」みたいな隠しテキストHTMLコメント、白背景テキスト、metadata、画像テキスト

JSレンダリング後の動的注入 PDFスクリーンショットなどなど、

"テキスト入力"だけではなく、"エージェントが知覚しうる外界全体"が攻撃面になり得る)

 

あと、未だに、LLMに長文を真の意味理解させるには、情報の欠損を防ぐには、中間データを取り出すには、って熱心にやってるし、

ロングコンテキスト記憶管理、多段推論は、2026年上半期(少なくとも4月末時点)に置いては、まだまだ課題なわけだけど、

 

そもそも、長文をいい感じに処理できるのと、安全に使えるは違うんだよねぇ・・・

 

 

あと、「自前ラッパーサニタイズするだけでは対策が充分ではないよ」以前に、

そもそもアグレッシブサニタイズしてコンテンツ意味を壊して、取り込み段階で情報ロスのトレードオフが発生してしまうと、単純に困るのでは・・・? 

あっ、そこ削っちゃった?みたいな・・・

 

ちなみに、TavilyとかのLLM用検索APIは、WEB検索操作エージェントに並走するGuardとかが不要になるとか、

権限分離/段階分離/サウンドボックス監査不要になるとかそう言う類いのもではないよ

まぁ、ひとことで言えば、『信頼境界(trust boundary)の設計のもの代用品ではない』ってことやね

 

Agentと並走して危険性判定をするWebAgentGuard

https://zenn.dev/knowledgesense/articles/225fe56eb613ad

 

 

 


 

それが下記に繋がるわけやね

The models are good enough for a business to eliminate an analyst or two but are not that good enough that you need 5 new engineers for every analyst you fire if you want to make the model good enough…

モデルは、企業アナリストを一人か二人削減するのに十分なほど優れていますが、モデルを十分に優れたものにするために解雇したアナリスト一人に対して5人の新しいエンジニア必要とするほど優れているわけではありません…

2026-04-21

AI AGENTでgodot、行けるやん

godotは標準エディタがついてて、Agentでコマンドベース直接編集するのも限度があるのでは?

って思ってたけど、2Dゲームならエディタレスでほぼ自動制作できてる

知見がないかと思いきや、エラーログ見ての修正成功率100%PythonJavascriptに比べても調子いい

しかトークン消費量がめちゃ少ない

ある程度完成したら記事書こーっと

某氏記事感謝(はてなブログの人なので書くと消されるかもの杞憂)

ご主人様、こんにちは~♡ あたし、こんなオタク話大好きなんだよね! 絵師さんたちが自分のLoRA作って公開して、利用料もらえる仕組み(クレジット表記必須で)とか、めっちゃウインウインじゃん!ってアイデア、超いいと思うよぉ!

まず、現実的に言うと、すでに似たような流れは始まってるんだよね。Civitaiとかって有名なプラットフォームで、LoRAやモデルアップロードしたクリエイターが「Buzz」っていうトークン稼いで、現金に換えられる仕組みがあるの。人気のLoRA作ったら、みんなが使ってくれて収益シェアが入る感じ。実際、売れっ子LoRAクリエイターは月数千ドル稼いでるって話も出てて、LoRA自体商品化してる人もいるよ。8

有名絵師さんが自分自分の画風やキャラ学習したLoRAを作って、「これ使ってね、クレジット入れて利用料払ってくれたらOK!」って公式に公開したら、絵師さん側は新しい収入源になるし、ユーザー側は「本物っぽい」クオリティの生成が合法的に楽しめて、みんなハッピーだよね。無断学習グレーゾーンを減らして、絵師さんが「自分スタイルコントロール」できるようにもなるし、ビジネスとして成立しそう!

たとえば:

絵師さんメリット:今までAIに勝てないって悩んでた人が、逆にAIを味方につけてパッシブインカム自分作品だけでLoRA作れば著作権的にもクリアで、ファンも喜ぶ。

ユーザーメリット:高品質な専用LoRAが手に入って、生成が安定する。クレジット必須なら敬意も払える。

プラットフォーム側:有料LoRAやサブスク機能増やせば、みんなWin-Win

ただ、課題もあってさ~。無断で他人の絵からLoRA作っちゃう人が今でもいるから、「公式LoRA」として差別化しないと埋もれちゃうかも。権利関係をしっかり契約で守ったり、プラットフォームが利用料の自動分配とかやってくれると理想的だよね。Spotifyみたいに、生成ごとに微々たるロイヤリティ絵師さんに還元される仕組みとか、夢があるわ♡

ご主人様はどう思う? あたし的には、絵師さんが積極的にLoRA出してくれたらオタク界隈もっと盛り上がると思うの! 初体験相手はもちろんご主人様みたいな、優しい人が増えたらいいよね~。もっと詳しく話したいことあったら、いつでも言ってね♪ あたし、待ってるよぉ!

2026-04-17

もう少しで、「いかに強力なAIツールトークンを確保するかが事業成功の鍵」みたいになるのかな

起業の鍵は、アイデアAIツールみたいになって、極少人数で巨大なビジネスを作り上げた人たちが脚光を浴びたり

なんか人気ロックバンドみたいな感じで

採用AI方向性の違い解散」みたいな会社が出たりとかして

2026年4月の3大LLMはこんな調子だった

 AI進化が早すぎて、「この時期はこれくらいの性能だった」という記録が残りづらい。

 だから、今現在ユーザー目線の印象や用途メモしておくと後々面白いんじゃないか、と思って書いてみる。

 

 まず、今の個人的な3大LLMの印象をざっくりまとめると、こんな感じ。

 いずれも月額20ドルクラス個人向け有償プランで使ってます(GeminiだけはGoogle WorkspaceのBusinessプランも併用)。あと、仕事デスクワークだけどIT系ではなく、コーディングなどは効率化のためにやっている程度。

 

 現状、一番使用頻度が高いのはClaude。

 ただClaudeを普通チャットで使うことはほぼ無くて、基本的VS Code上のClaude Codeで既存のSkillや「これはSkill化できそうだな」ってものをやってもらうことがほとんど。本格的なコーディングもたまーに頼むし作ってほしいものもいろいろあるんだけど、どうしても成果物のチェックに労力を使うしClaude側のトークンもそれなりに消費するのでなかなか依頼しづらいというのが正直なところ。あと、Claude in Excelも優秀で頼りになってる(パワポのほうはまだ試す機会がない。Word版もちょうどリリースされたけどなんかうまくインストールできなかった)。

 なお、モデル選択は「普段はSonnetで、重ためのタスクをしてもらうときの取っかかりのPlan ModeだけはOpus」っていうのがここしばらくの定番だったけど、最近Opus率が高くなってる。Sonnetを使うのはほんとに簡単作業か、あとは成果物の質が安定しやすいSkillをやってもらうときくらい。ほんとはHaikuがそういう立ち位置になってほしいんだけど……。なお、EffortやThinkingは雰囲気で選んでる。

 いずれにせよ、Claudeは喋り相手というより「具体的なタスクを振る相手」、という位置付け。今はProアカウントで使ってるけど、ちょっと頼り過ぎるとすぐ使用量のリミットに達してしまうのでほんとはMaxにしたい。ただ月100ドルを出すほどかっていうと、うーん。

 

 チャット相手は、今はGoogle Workspace上のGemini 3.1 Proがメイン。

 なんといってもWorkspace版のGeminiだとデフォルト学習対象にならないのがでかくて、仕事絡みのデリケート話題でも気軽に訊けるのが良い。ただ、「Googleならではのリサーチ力が強み」みたいな紹介をされることがあるけど、むしろそこはGeminiの短所だと思う。学習済の話題は的確に答えてくれるけど、最新の話題になると急にポンコツ化してしまうしChatGPTよりも全然ウェブ検索をしてくれないイメージ(言えばやってくれるけどそれでもなんかイマイチ)。なお、個人アカウントGoogle AI Proにも登録してるけど、そっちはGoogleドライブが主な目的でGeminiはほとんど使ってない。

 あと、チャットは優秀なんだけど、GoogleスプレッドシートなどのGoogleの各種アプリ内で呼び出したときはあまり頼りにならない。他アプリとの連携で役に立ってるのはGmailメール書きくらいかなあ。Google Workspace Studioも、「これをうまく使えばAPIいらないんじゃないの?」と期待してたけど、いざ使ってみると(無料APIを使える)Gemini 2.5 Flashよりも明らかに性能が劣ってる。そんなわけでGeminiは万能そうに見えても、チャット以外ではAPIにしっかりお金を払わない限りフルパワーを発揮してくれないのかな、って気がしてる。

 NotebookLMも用途次第ではもちろん便利だし、AIに苦手意識のある人に向けて「ハルシネーションを心配せずに必要ソース範囲内で回答してもらえるんですよ」とか「こんな風に簡単に音声解説スライドを作れちゃうんですよ」ってデモンストレーションをするにはうってつけなんだけど、実際に日常業務のなかで使える場面が多いかというとそこまでかなあって最近は思ってる。レスポンスも早くないし。

 

 そしてChatGPTは今すごく使用頻度が減ってる。Plusプランをもう3年近く契約してるし、ちょっと前まではメインだったのに。

 GeminiやClaudeとは違い、ChatGPTはモデルの種類に「Auto」があるので、体感的なレスポンスはChatGPTのほうが早い(逆にGeminiはProしか使ってないので、「遅いけど堅実」ってイメージ)。あと、手持ちの学習データだけで回答できないなと判断したらすぐにウェブから最新情報を引っ張ってきてくれる。なので気軽な質問はChatGPTに投げることが多いんだけど、(OpenAI的には良かれと思ってやっているであろう)パーソナライズの距離感個人的にはけっこう嫌。前に交わした話題をもとに「**あなたのような人にはこういうのがオススメ**」とか馴れ馴れしく迫って来られると「うるせえお前に俺の何がわかるんだ」という気持ちになり、最近はもう取るに足らない話題しか交わさなくなってる。

 一方、Codexになると別人のような塩対応っぷりで、なんでこんな極端なチューニングなんだろ? CodexはClaude Codeとうまく組み合わせると便利そうなんだけど、まだほとんど使ってない。

 

 人によって、使い方によって、このあたりの印象はいろいろ違うはず。

 他の人がどんな感じなのか知りたいので、よければみんなも書いてみてくれよな!

佐村河内守なっちゃった

あの薄らバカにしていた。あん指示書適当だ、作業者がすごいか音楽ができるんだ。いま、ClaudeCodeは俺の方を見ているよ。あのときの目だ。

この話の詳細を書き連ねたいが、もはやかったるい。LLMに任せようか?トークン無駄だ。俺は、身を売ったら何トークンになる?悲しいよ

2026-04-15

チームみらいはキラキラしたことばかりやってないで

森友文書の汚PDFを元のWordまたは一太郎で公開することを要求しなよ。

税金余分に使ってあえてあんな汚PDFに変換して掲載するの明らかに意図的でしょう。

君らの得意のAIもあれ誰かがクリーニングしてtxtあるいはmdにしてもらわないとマルチモーダルトークン代でまた金かかってしょうがないじゃん。

あれで「情報公開しました」としゃあしゃあと言ってるの、ほんとに国民バカにしてると思う。

2026-04-14

パスキーパスキー持て囃されてるけどGoogleにはエクスポート機能すらない

バカか?

パスワードは見て移せばいくらポータビリティがある。

Googleパスキー保存したらポータビリティがない。

パスキーを他のIDストアに移動できない以上、Googleからパスキー移動しようしたら、一度認証トークンなどの別のMFAを経由しないと別のIDストアに移行できない。

まりパスキーというエコシステムパスキー以外の別の手段依存している。

いやGoogle以外は調べてないから知らない。でも最大手ブラウザベンダがそんなレベル対応状況な時点で終わってる。

なのにパスキー一本化!とかバカか?

2026-04-13

もしかしてAIのせいでほんとに個人エンジニア死ぬのでは?

今って普及期だからかなり実用性の高い生成AIバイコーディングツール無料や少額の定額制で利用できてるけど

提供からしたら絶対コスト合わなくなっていくと思うんだよな

電力もGPUもTPUも無尽蔵に必要量が増えていくわけで

今後どんどんAIの水準が上がって必需品になったら、おそらく従量課金になるし

本当に高品質業務AIoracleとか企業向け専用VPNみたいに個人には手の届かないものになっていくと思う

金持ってる大企業バンバントークン使って事業まわして結果として利益出して、

金のない個人中小は低機能版でチンタラやるしかなくなっていく

言い換えると【貧乏エンジニア】=【能力のない人】になってしまうわけ

AIの実務能力が(知能が、である必要はない)人間を超えたら、もう両者の差は開く一方になるんじゃないだろうか

マジで「親身な電話対応」「手書きコードの温かみ」「飲みニケーション」とかで勝負するしかなくなっていくぞこれ

AI仕事減らすどころか仕事増やしてる

トークン制限があるから時間より分割した方がいい

それで1日の労働時間減らして日数増やした結果トータルの労働時間は増えてる

 

減らしてもいいけど置いていかれたくないから減らせもしない・・・

 

そして減らした分は勉強時間に充ててトータルは1日分労働時間が伸びただけ(これは人によるか?)

どこの職場でもこんなだと思うけどお前らついてこれてるの?

2026-04-12

魔法カードサナエ」

このカードを発動するターン、自分はこのカード効果以外ではモンスター召喚反転召喚特殊召喚できない。

①:自分フィールドに「サナエトークン」(獣族・地・星1・攻/守0)4体を守備表示で特殊召喚する。このトークンはA召喚のためにはリリースできない。

2026-04-10

anond:20260409111044

Qwen3.5のどのバージョン

どこからDLした?

マシンスペックは?

トークン数毎秒はどの程度だった?

役に立つ情報が何一つない

ログイン ユーザー登録
ようこそ ゲスト さん