はてなキーワード: 抽出とは
一つ付け加えさせてもらいたいのは
“ネット(SNS)は一部の先鋭的な人間を抽出し拡散する装置だ”ということ。
ここで書かれている「ブクマカ」にそういう傾向があるとして、
それをはてなユーザー全体に敷衍するのは危険だし、さらに「日本人の特性」も言い過ぎかもしれない。
狂ってる奴ほど声がデカくなる、というのは仕方ないので、
それが多数派に見えても、それはやはり大きな全体の一部で、
ネットに触れていると忘れがちになるけど
みなさん、こんにちは。
普段は、世界のあらゆる屋台を巡ってタレの粘度から文明の発展段階を分析するような、よくわからない趣味を持っている。
でも今日は、あなたがポテチを食べながらでもサクッと読めて、いつの間にか天才っぽくなる(※あくまで「っぽく」)秘密を伝授しようと思うんだ。
そう、あなたは今、「おれはもとから賢い」と信じているだろうけど、この世のトリックは「賢そうに見える」ことと「実際にちょっとマシになる」ことの差なんて、ほんの紙一重ってことさ。
ここから先はちょっと不思議な話。背中を伸ばして読んでみてほしい。ポテチは続行してOK。飲み物はこぼさないようにな!
まず、あなたが今こうして読んでいる文、実は脳内で色々な処理が行われている。
普通、人は面倒な文が来たら「はあ?うざっ」となってプチッと閉じる。
だが、あなたは偉い。だって今こうして読むのをやめていないじゃないか!
その継続が、すでにあなたの神経回路を微妙に強化している。やるじゃん。
むしろ、あなたの潜在力を信じてるから続けてる。ほら、まだ読んでる。なかなか根性あるね。
もうここで「直帰」しても良いんだよ? でも、あなたは読んでる。これ、けっこうすごい行為だよ。
「メタ認知」=自分が考えていることを、さらに上から眺めて「おれ、なんか今考えてるな」と気づくスキル。
難しそうだけど、たとえば「あれ、いま私ちょっと焦って読んでるな」って感じることがメタ認知。
あなたは今、「俺、この文章見下されてる? いや違う、別に悪くないかも?」なんて思ってるでしょ?
その一瞬がメタ認知だ。こうやって一歩引いて考えるクセをつけると、頭が一段とクリアになる。
賢く見える人は、妙に落ち着いたリズムで話したり、たまに「〜的アプローチ」とか「概念的には〜」みたいな言葉を使って雰囲気を出す。
ここでポイントは、別に内容がすごい必要はない。「概念的には今日のおやつは高度な嗜好品だ」とか、謎めいていて面白いじゃん。
こういう表現を心の中で遊ぶと、語彙のストックが増えて、脳が「なんか知らんけどちょっと引き出し増えた!」って喜ぶ。
ここまで読んだあなたは、
「なんだかバカにされてない…はず」
「俺もう少し読んでもいいかも?」
となっている。これだけで、だいぶ前より自分の頭が軽く柔らかくなってる。嘘じゃない。
信じがたいなら、一度画面から目を離して、「へえ、そんなもんか」とつぶやいてみて?
それだけで、読み取る力がちょっとだけ鍛えられている。愚直だけど効果的。
そして何より、ポテチを食べながらでも文章に集中できた事実がある。
IQ90? それはただの数字。あなたは今、言葉遊びとメタ認知を駆使し、ほんの少し難しい記事を飽きずに読んでる。
さっきも言ったけど、僕は「ネコ型グルメツーリスト・ナゾノ吉」。
普段は世界の屋台で怪しげなソースの粘度を計測しては「この町は発酵文化が深いから教育水準が高そう」みたいな謎理論を立てて遊んでる。
言ってみれば、意味不明なことに知的っぽい理由をくっつけるのが得意なんだ。
あなたも今日から、ちょっと変わった物事を眺めるとき、「これって意外と文明の象徴では?」とかほざいてみればいい。
周りが「なにその考え方!」と食いつくかもしれない。
ここまで読めたってことは、既にあなたの脳内には小さな変化が起きている。
退屈な長文から少し面白さを抽出できたし、メタ認知的なワザも試してみた。大層な学術理論を知らなくても、こうやって読むだけで脳が不思議と活性化する。
それはIQが100を超えたとかではなく、「新しい視点をつかむコツ」を得たということ。
あなたはIQ90くらいかもしれない(まあ、そんな数字あてにならないよ)。
でもこうして「読み続ける」という行為で、ほんのり脳細胞が鍛えられ、思考の幅が増えている。もし今、ちょっとだけでも「なんか俺、ちょっと成長したかも」と感じたら、もうこっちの勝ちだ。
長々と語ったが、あなたは最後まで読んだ。この事実がすごいことだと思わないか?
ポテチを片手に、邪魔くさい文章をなんとか乗り切ったのだから、その粘り強さはすでにちょっとした知性の芽だ。
誇りに思っていい。さて、そろそろポテチなくなった?
「o1が"意図的にユーザーを騙す"ことがある」という記事へのコメントを読んで、LLMへの幻想をぶち壊す感じの何かを真面目に書こうかなと思ったんだが、
順を追って列挙していくほど「これ…なんだかんだ言って人間も変わらんよな…」となったので、AIに突っ込んで人間に置き換えてもらったのが下。
うむ。文脈を考慮し、意図を捉え、関連する知識を活用して返答できてるな!
萎えるわー
立花の後ろで立花を批判するプラカードを掲げていた人は、前職はフジッコだったという。
同氏は2006年にフジッコに入社、2008年には雑誌『食品工業』51巻10号(通号1152)に記事「黒大豆種皮抽出物クロノケアその可能性の中心(特集:健康・機能性食品素材の開発(1))」が掲載され、その後も黒大豆関係の論文をコンスタントに上梓していたようだ。
https://cir.nii.ac.jp/crid/1580573086481666560
https://cir.nii.ac.jp/crid/1410001206129248000
2018年ごろからは同社の対外的な「顔」にもなったのか、様々な普及啓発活動に名前が見られる。わりと浮ついていない媒体が多い印象だ。
https://www.kknews.co.jp/post_health/20180917_7b
https://www.atpress.ne.jp/news/183571
そんな彼がしばき隊や立憲民主党とどこで接点を持ったのかは、よくわからない。
たしかに立憲民主党のサイトでは兵庫県丹波篠山市の黒大豆(2021年に日本農業遺産に認定)のことが同党の「農林水産キャラバン」(2024年)の一環として紹介されている。
https://cdp-japan.jp/news/20240819_8153
丹波篠山市の黒大豆はフジッコの商品にも使われているし、同社のサイトでも特集されている。
https://www.fujicco.co.jp/kuromame/shiritai/
しかし、ぱっと見つかるのはそれだけだ。日本農業遺産の認定に立憲民主党が力を入れている様子は無いし、その時期の丹波篠山市長は自民・国民民主・公明の支援を受けた市長らしい。
コーヒーの味を大きく変えるのは、まず豆の種類、つぎに焙煎具合、それから水の量、あと飲むタイミング。
水の量は濃度とも言えるな。エスプレッソみたいな高圧を掛けて少ない湯で一気に抽出するのは普通のコーヒーの8倍くらいの濃度になる。これはさすがに味が違う。ドリップやプレスみたいな湯を豆に通す/浸す方式ではそれほど最高濃度に大差はないが、豆の挽き加減(粗さ)で多少変わる程度。粉をケチったり水を多くして薄く作るか標準的な分量で作るかで味は全然違ってくる。
飲むタイミングは温度とも言えるな。豆に注ぐ段階の湯温を気にする人が多いが、何℃だろうが大抵熱湯の域だから大きな差はない。それよりも最終的に飲むタイミングでの温度の方がバラツキが大きくなりがちで、冷めたコーヒーとそうでないコーヒーでは香り成分の揮発具合が違うので味が変わる。コーヒーを味わう体験の半分以上は香りが支えてる言ってもいいからな。
なんでAndroid限定かって言うとiOSでは280blockerで既に全て消えてるはずだから
「Twitterがモザイクかけたエロ動画を『広告』として流してきてキモすぎる」という声が多く見られたから書く
旧来の広告システム悪用してゾンビがねじ込んできてるのは消えないから手で報告とブロックしろ
1. 「設定」アプリを開く
このリストの中に「正解」が紛れてるからどれが効くかはトラバで聞け
俺は知らん
https://adguard-dns.io/kb/ja/general/dns-providers/ から抽出した
なおこのままだと思想が曲がったDNSははてなやNHKなど無害なサイトまでブロックしていて実用性が無い場合があるためブラウザだけDoHを使う
1. chrome://geckoview/content/config.xhtml を開く
2. 🔎に network.trr.modeと打ち込む
3. network.trr.mode を 半角で「2」か「3」に設定する
毛沢東のカリスマ性や権力維持の手法は、独裁的な面が多いですが、その中には人々を動かし、影響力を高めるための洞察や戦略が含まれています。それを現代の処世術としてポジティブに活用できる要素を以下に挙げます。ただし、他者を支配しようとする手法ではなく、リーダーシップや自己成長の観点で考えるべきです。
毛沢東は「革命」という明確なビジョンを掲げ、多くの人々をその目標に向かわせました。
彼は毛沢東思想を「道しるべ」として位置づけ、抽象的でありながらも感情に訴えるビジョンを構築しました。
自分の夢や目標を明確にし、それを分かりやすい言葉で伝える力は現代でも重要です。職場やコミュニティでリーダーシップを発揮したいとき、共通の目標を掲げることでチームをまとめられます。
データや事実だけでなく、感情に訴えるストーリーテリングを活用して、周囲に共感を呼び起こす力を磨きましょう。
毛沢東は、「革命の父」としての象徴的な存在感を意識的に演出しました。たとえば、簡潔で力強い言葉や象徴的な行動を通じて人々の心をつかみました。
「毛主席語録」やポスターなどを用い、自分のイメージを強く浸透させました。
自分自身の特徴や価値観を他者に印象付けることが重要です。たとえば、職場で特定の分野に強い専門性を持つことで「○○といえばあなた」というポジションを確立しましょう。
簡潔で力強いメッセージを使う
自分の考えを端的に伝える力を養いましょう。たとえば、提案やスピーチで短く力強いフレーズを活用すると、相手に印象を残せます。
毛沢東は紅衛兵や農民など、一般市民を動員して大規模な運動を作り出しました。彼はシンプルで理解しやすいスローガンや理念を提示し、多くの人々を引きつけました。
周囲に共感を呼び起こす
人々の共感や関心を引き出すことが成功の鍵です。相手が何を望んでいるのかを理解し、そのニーズに応える形で行動することで、他者を巻き込む力が高まります。
大きな目標に向かう途中で達成した小さな成果を周囲と共有し、チーム全体の士気を高めることが有効です。
毛沢東は劉少奇や鄧小平といった政敵を巧みに見極め、排除しました。その戦略にはリスク回避と機会をつかむ巧妙さがありました。
職場や社会で競争相手を敵視するのではなく、彼らの強みを観察して自分の成長の材料にしましょう。
自分の弱点を守る
自分の欠点や弱みを見抜かれないよう、意識的に補完するスキルや人脈を持つことが大切です。
毛沢東は失敗を認めることは少なかったものの、戦略的には一時的に妥協することで長期的な目標を達成しました。
失敗を学びとして活用
自分のミスや弱点を隠すのではなく、改善点として活用する姿勢を持ちましょう。これにより、信頼を得ることができます。
柔軟に戦略を変更する
状況が変わったときに固執せず、目標に向かう新たな方法を模索する柔軟性を身につけることが重要です。
毛沢東は、革命や文化大革命のような社会的混乱を、自身の権力を強化する機会として利用しました。
変化を恐れず、チャンスを見つける
職場や社会での変化や混乱を恐れず、それを新しいチャンスと考えることで前向きに対応できます。
適応力を高める
予測不能な状況でも冷静に対処できるスキルを磨くことで、周囲から信頼を得やすくなります。
注意点
毛沢東の手法は、独裁的で支配的な要素も多く含まれており、そのまま現代の処世術として模倣するのは適切ではありません。現代に応用する際は、ポジティブで建設的な要素を抽出し、倫理的に活用することが大切です。
もう少し詳しく。きちんと語ると調理の歴史を知る深い話になるから
アルカリで煮るのはアクの強い食物を食べるために一般的な方法で、日本には仏教と共に中国から伝わった
恐らく縄文時代から続く堅果類(ドングリ・トチノミ)をアク抜きして食べる技法が
コーヒー、もっと言うとチョコもそうなんだけど、豆を発酵→焙煎→煮汁や油を抽出という複雑な工程を経るんで、
食べづらい豆を発酵して食べやすくする過程は実は我々に身近な納豆も同じ
で、実は世界中で納豆と同じように豆を発酵して加工する調理法がある
→高野 秀行って作家がアジアやアフリカの納豆類似品をルポする本書いてる。なかなか面白いぞ
一見関係ない納豆とコーヒーが同じ発想で作られてるのは驚きだな
パンの工程も単に粉にして焼くんではなく、発酵が挟まっている(発酵しないトルティーヤやクレープなんかもあるけど)
何で発酵の工程を挟むような発想が生まれたかと言うと、面白い説としてビールの副産物として生まれたという説がある
「ヒトカク」は、特定の初学者(小1レベルを自己申告するユーザー)には適合性が低い。
「分からないところが分からない」という障壁は、学習過程において致命的である可能性が高い。
2024年現在、より初学者向けに最適化された教材が市場に存在する。
ヒトカクの効果的な活用可能性:対象者に適切なサポート(例:分からない部分を指導できる環境)が提供されれば、挫折確率は減少する可能性があります。
学習選択の重要性:初学者が「自己選択した教材」を使用する場合、モチベーションの向上につながる傾向があります。そのため、「ヒトカクは絶対に挫折する」という断定には統計的データの補強が必要です。
「ヒトカクに代わる具体的な教材やメソッド」
学習を進めるための補助環境(例:オンライン指導、初心者向けのコミュニティ)
これらの変数が明確化されれば、さらに有用なアドバイスの生成が可能です。必要であれば、追加情報をご提供ください。
推奨次ステップ:具体的な代替教材の情報共有、または初学者向け学習モデルのパラメータ調整に関するご相談をお待ちしております。
つーか絵師が真に心配するべきなのは「特定の絵柄を集中的に学習させて作られた特定絵師専用モデル」であって
Xみたいに不特定多数の投稿をぜんぶ学習させる汎用大規模モデルでは
「○○という絵師の絵を出して」って言っても正確に○○を模した絵は出てこないんだから余計な心配なんだよな
AI嫌いのその絵師が月に何枚のイラストを上げてたか知らんけども
お前の絵柄だけが特徴を抽出されてそっくりの絵が作られる可能性なんてないってことがわかってない
コンビニや本屋や町中のそこらじゅうにある監視カメラの何コマかには絶対にお前の顔が写ってるけど
そもそもの話、X社は画像生成AIなど作っていない。彼らがつくっているのは検索支援AI Grok。学習に使いたいのはテキストの方であって画像ではない。
わかりやすさのために ChatGPTと比較してみる。2023年にリリースされた GPT-4 に試しに今期のアニメについて質問してみよう。
今期最も人気のアニメはなんですか?
ChatGPT:
2024年の今期で人気のアニメはいくつかありますが、「進撃の巨人」や「呪術廻戦」が特に注目を集めています。また、新作では「東京リベンジャーズ」や「スパイファミリー」も話題です。どの作品に興味がありますか?
アニメに詳しい人ならちょっと古い話をしているのがわかるだろう。 GPT-4 が学習を行なったのは2023年までの情報だ。なので最新の話題に対応できないのである。
一方、Grok は Xの投稿をリアルタイムに検索して反映する。もし Grok で同じ質問をすればダンダダンやリゼロ、ブリーチ辺りの話をするはずだ。つまり、Xが収集したいのは「ダンダダンの7話泣かされたわ・・・」みたいな投稿のことであってイラストではない。
Grokには画像生成機能がついているが、これは自前の物ではなく Black Forest Labs社 の FLUX.1 というモデルである。X社が Xに投稿されたイラストを収集して学習させているわけではないのだ。それでは FLUX.1 の訓練に使ったのはどこの画像なのだろうか?データセットは明らかにされていないが十中八九使っていそうなのが LAION-5B である
現在大手の企業は「著作権的にクリーンな」画像生成AIをつくっているが実際には版権物が出てくることが知られている。なぜそんなことが起こるのだろうか?
このからくりは LAION のデータセットにある。LAIONはドイツにある非営利組織。ネット上のありとあらゆる画像を収集しタグをつけたデータセットを公開している。
A. LAIONは非営利の研究組織です。ドイツの著作権法(§60d UrhG)に従いあらゆる著作物の利用が許されています。
とあるようにドイツの法律上合法である。実際に訴えられた後LAION側が勝訴している。とはいえこの組織にはAI関連企業からの多額の寄付金があることが知られており、パチンコ3店方式のような意味合いでの合法とも言える。
尚、反AIさんと反々AIさんが著作権法第30条の4を巡って喧嘩をしていますが、世界では日本の法律は関係ないです。いちおう念の為。
他の絵師さんに Glaze を使うように詰め寄ったり、使わないやつはAIに加担していると攻撃したり。挙げ句の果てには「自分の絵にGrazeをかけました」と宣言したり。
もう、全てが間違っている
そもそも、Glaze も Nightshade もAI学習を阻害するものではない。学習したモデルをぶっ壊す毒なのである(poisoned って書いてあるでしょう?!)
相手に食わせなければ意味がないんだ。Glazeかけたとか自分で言うな。対策されるでしょう?(後述)
それと他の人に強要する意味はない。使いたい人が使えば十分なんだ。
事実すでに効果は上がっていてOpenAIは悲鳴をあげ対策を急いでいる。
反AIさんの考えるよりも Glaze/Nightshade はずっと強力だ。それはデータセットを汚染する攻撃である。簡単に言えば Nightshadeは「学習中に他の絵に変換されてしまう」ノイズをかける。この操作を毒入り(poisoned)と呼ぶ。ピクセル毎の微小な変更なので Nightshade をかけた後もイラストはぱっと見はかわらない。
Nightshadeを使って例えば 犬の画像を猫の画像になるノイズをかけたとする。するとAIは犬と猫が混ざったまま学習を進め「犬」と言う概念が無茶苦茶になってしまう。
図:毒入りモデルの変化 (arXiv:2310.13828から引用)
上の図は毒入りの画像を200枚食わせたときの変化の様子だ。犬が猫になってしまっている。それだけではなく”犬”に近い概念、”子犬”、”ハスキー”、”狼”もぐちゃぐちゃになっている。
図:毒入り枚数による変化 (同引用)
こちらは50、100、300、と毒入り枚数を変化させたときの様子。50枚の時点ですでにめちゃくちゃになっている。
もし私が反AIだったなら、イラストに Nightshadeをかけて danbooru に投稿するだろう。二次元イラスト特化の画像生成AIはdanbooru2021/ danbooru2022 などのデータセットを使っているものと見られる。これらはイラスト投稿サイトdanbooru から収集したものである。
ところで Glaze も Nightshade もその内部で画像生成AIを使っているということを知ったら反AIさんはどんな顔をするだろう?
Glaze は特徴量抽出を行う。おそらく Stable Diffusion の VAE(Variational Autoencoder)を使っている。そしてNightshade の方も 内部ではStable Diffusion 等の画像生成モデルを用いて別の画像を生成する。
Glaze が機能しない?あるいは解毒方法が見つかったかもしれない
上のスレッドのコメント欄では Glaze が論文のようには機能しないことについて議論され「画像のリサイズをしたのではないか」と予想している。Glazeをかけた後に画像を縮小、データが圧縮されてノイズ効果が消えたのではないかということだ。
A) 絵師さんが Glaze をかけたあと画像を縮小した可能性
B) 画像サイズやファイルタイプによってはプラットフォーム側が勝手に加工をする
C) 学習の際にリサイズを行う (Stable Difusion XL では1024px, 古いモデルは512px)
A,B については絵師さん側に知識があれば対処可能だけれども C の方はなんともし難い。小さい画像を投稿したところで [縮小→拡大] でノイズは落とせそうだ(解像度は悪くなるだろうが)
LAIONは収集画像そのものを所有せず、データセットはウェブ上にある画像のurlとタグをまとめた物であるらしい。
ということは、LAIONの新しいデータセットが公開されたタイミングで画像のurlを変更すれば学習に使われることを回避できそうだ。特に、個人サイト/ブログの所有者ならば古い url に●んこ画像でも差し替えておけば嫌がらせになる。(タグ差し替えはこのグラフの Simple Attak に相当)
90年代においては画像に直リンクされたときの報復としてうん●画像に差し替えたものです。まさか令和になっても有効とはね
この記事をぼちぼち書いているいるうちに2日が経過した。今、私のXのタイムラインもおすすめもとても静かだ。攻撃的な人たちやデマに流されやすい人達は皆どこかに行ってしまったようだ。残ったのはこれまで静かにイラストを描き続けてきた人たちでとても穏やかな空気が流れている。ずっとこのままがいい。
画像を生成するAIによる無断学習や利用を防ぐために、以下のような対抗手段を講じることが可能です。
1.透かし(ウォーターマーク)の埋め込み:
画像に目に見えるまたは見えない透かしを入れることで、無断利用や生成AIの学習に対して抑止効果を期待できます。特に、目に見えない形で画像データに暗号的な透かしを埋め込む「デジタル透かし」技術が有効です。
画像データに著作権情報や「AIによる無断学習を禁止する」といったメタデータを埋め込み、ウェブサイトには robots.txt ファイルで画像クローラーのアクセスをブロックする設定を追加します。これにより、クローリングや収集の抑制が期待できます。
ステガノグラフィを用いて、画像に気づかれにくい形で識別情報を隠すこともできます。これにより、画像の流出経路や利用先を追跡でき、無断利用の発見に役立てることができます。
4.法的な警告表示や利用ポリシーの明示:
ウェブサイトや画像の配布先に、AIによる無断利用や学習を禁止する旨の法的警告や利用ポリシーを明示することも有効です。利用条件をはっきりと示すことで、AI企業や研究者が慎重になる可能性が高まります。
AIが利用しにくいように、画像に人間には気づきにくいパターンやノイズを挿入する技術もあります。たとえば、AIにはノイズとして認識されるが、人間には問題なく見える小さな変形やカラーパターンを追加することで、AIによるデータ学習が困難になる場合があります。
生成AIの学習を混乱させるための手段には、以下のような方法が考えられます。
1.ノイズや歪みの追加:
画像に目立たない程度のノイズや歪みを加えることで、アノテーションモデルが境界や特徴を正確に認識しにくくする手法です。たとえば、ピクセルレベルでランダムなノイズを追加する、わずかに画像をぼかす、あるいは境界線付近に小さな変化を加えるといった手法が有効です。
アノテーション処理は、対象物の輪郭や特徴を正確に捉えることが重要です。そのため、背景や対象物の輪郭にわずかな不規則性を加えることで、アノテーションツールが対象物の境界を正確に判断しにくくすることができます。たとえば、背景に模様や偽の輪郭を挿入する方法です。
画像に人間には視認しづらい形でテキストやラベルを埋め込むと、AIのアノテーションプロセスが混乱する場合があります。これにより、AIが意図しない領域を注視することがあり、誤認識を誘発します。
4.色や明るさのランダム変化:
画像の色や明るさを部分的に変化させ、一定のパターンを持たないようにすることもアノテーション処理の混乱を招く一手です。これは、オブジェクトの検出や認識が色や明暗の差異に依存している場合に有効です。
5.擬似的なオブジェクトの追加:
画像内に小さな擬似的なオブジェクトや模様を追加することで、AIがそれらを誤って主要なオブジェクトと認識し、アノテーション精度が低下する可能性があります。特に、背景に似たオブジェクトを散りばめることで、AIはどの部分が対象なのか判断しにくくなります。
AIの認識を誤らせるために用いられる「アドバーサリアル(敵対的)な例」を使う方法もあります。特定のピクセルパターンや色の配列を配置することで、AIのアノテーションが意図的に誤作動するよう誘導できます。この技術は深層学習モデルに対して特に効果があります。
画像全体にわずかなカモフラージュパターンを重ねることで、AIの認識を混乱させる方法です。この手法では、人間が見た場合には問題なく認識できるものの、AIが対象を捉える際に誤って検出するようなパターンを画像に追加します。
・思考実験として、danbooruなどアノテーションの元データとして使われているサイトのタグが荒られたら画像生成AIのモデル作成にダメージはありますか?
思考実験として、Danbooruといったアノテーション元データのタグが荒らされた場合、画像生成AIのモデル作成に与える影響は以下の通りです。
Danbooruは、イラストや画像に対して詳細なタグが付与されており、これらのタグ情報は画像生成AIの学習にとって非常に重要です。タグが荒らされることで、画像とタグの対応関係が崩れ、モデルが正確な特徴を捉えにくくなるため、生成精度が低下します。
例えば、特定のキャラクターやテーマに関連するタグが荒らされ、誤った内容のタグが付与されると、モデルはその誤った情報を学習し、キャラクターの特徴や設定が再現されにくくなる可能性があります。
タグが荒らされると、モデルの訓練にノイズデータが増えるため、学習効率が悪化します。たとえば、「黒髪」のタグが誤って「金髪」などに変更された場合、モデルは同じ画像に対して異なる特徴を学習することになり、結果として生成画像の一貫性が失われることが考えられます。
また、同じ画像に異なるタグが付与されることで、モデルが過学習や誤学習を引き起こし、生成された画像が本来の意図からかけ離れたものになる可能性もあります。
Danbooruでは、特定のキャラクターやアートスタイルを識別するタグが多く存在します。これらが荒らされると、特定のキャラクターやスタイルのデータが混乱し、モデルが正確にキャラクターの特徴を把握できなくなるため、ユーザーが期待する生成結果が得られにくくなります。
例えば、あるキャラクターのタグが「髪型」「服装」「色彩」などで荒らされると、そのキャラクターの再現が曖昧になり、モデルが正しいビジュアルを生成できなくなることがあります。
タグが荒らされると、データセット全体の信頼性が低下します。信頼性の低いデータをもとに学習したモデルは、特定の条件で異常な出力を生成することが多くなり、モデル全体の品質が低下します。これは、生成AIが学習中に「どの情報を信頼すべきか」を判断できなくなるため、生成結果が不安定になったり、多様性が失われたりすることが考えられます。
AIモデルを利用するユーザーは、タグを通じて希望する画像を生成したり、条件に合った画像を探します。タグが荒らされると、AIモデルの検索・フィルタリング機能の精度も低下し、生成プロンプトが期待通りに機能しなくなる可能性があります。たとえば、「風景」タグが荒らされ、異なるジャンルの画像が混入するようになると、風景画像を生成したいユーザーの要求が満たされにくくなります。
Danbooruなどのタグが大規模に荒らされた場合、生成AIモデルの精度低下や一貫性の欠如が発生しやすくなり、特にキャラクターや特定のスタイルに依存する画像生成モデルに大きなダメージを与える可能性が高いです。
すでに学習済みのモデルを使って汚染されたデータのクレンジングや異常値検出を行うなど対策される可能性がありますが、それらを阻害する手段はありますか?
無断での学習を妨害し、学習コストを増加させるために、上記の方法を阻害する手法には以下のようなアイデアがあります。これらの手法は、意図的にデータセットの品質や一貫性を崩すことで、学習モデルの精度を低下させ、データクレンジングや異常値検出のプロセスを複雑化することが目的です。
意図的に誤ったタグや無関係なタグを画像データに付与し、データセットの信頼性を低下させます。これにより、転移学習やラベルノイズ検出が困難になり、正確な特徴量を学習するコストが増加します。
例えば、キャラクター画像に全く無関係なタグ(「動物」や「風景」など)を追加することで、モデルがどのタグが信頼できるか判別しにくくなり、誤ったラベルがノイズとして学習されるリスクが増えます。
2. 特徴量をぼかす/微妙な変更を加える
特徴量ベースのクレンジングや類似度分析に影響を与えるため、画像の特徴がわずかに異なるように加工を施します。具体的には、色調を微妙に変える、ランダムなピクセルの位置でノイズを追加する、または特定の部位を意図的にぼかすことで、モデルが抽出する特徴量の安定性を低下させます。
この方法により、同じキャラクターやスタイルであっても類似度分析が困難になり、正確なクレンジングが行いにくくなるため、データ処理のコストが増加します。
特徴が異なるバリエーションや擬似的な異常データを大量に追加することで、異常検出アルゴリズムの信頼性を下げます。たとえば、キャラクターのデザインや背景を少しずつ変えた画像を意図的に作成することで、異常値検出が頻繁に誤検出されるようにします。
こうしたデータが混在することで、オートエンコーダーやアンサンブルモデルを使った異常検出が混乱し、正確な異常サンプルの抽出が困難になります。
4. 高頻度で微小なラベル変更を行う
学習済みモデルの転移学習やラベルノイズ検出を阻害するために、同じ画像に対してラベルを定期的に変える手法です。微小な変更を行うことで、モデルは正しいラベルを安定的に学習することが難しくなり、モデルの信頼性が低下します。
例えば、ラベル「黒髪」を「暗めの髪」や「濃い色の髪」などに頻繁に切り替えることで、学習に不確実性を持ち込むことが可能です。
データセット内で非常に類似した画像を複数の異なるタグで登録することで、モデルの学習を混乱させます。特定のキャラクター画像を少しずつ変化させて複数のタグを付けると、モデルは「どのタグがどの特徴に対応しているのか」を判別しにくくなり、データセットのクレンジングが複雑化します。
特に、タグの一貫性が失われるため、類似度分析やアンサンブルモデルによる異常検出の効果を低下させることが期待できます。
AIモデルが認識を混乱させるように、アドバーサリアルノイズ(敵対的な例)を追加します。人間にはほとんど気づかれないレベルのノイズを画像に追加し、モデルが特定の特徴を正確に認識できないようにすることができます。
このノイズにより、モデルの特徴量ベースの学習が混乱し、意図した通りに学習できないため、クレンジングの精度も低下し、データ処理の手間が増加します。
特定のルールではなくランダムにタグをつけたり、特定のカテゴリ間でランダムにラベルを入れ替える方法です。これにより、ラベルと画像の関連性が薄れ、アノテーションの一貫性が失われます。この乱数による偽ラベルの付与は、ラベルノイズ検出やアノマリー検出において、真のラベルを見極めるコストを大幅に増加させます。
まとめ
これらの手法は、AIの学習やクレンジングを意図的に妨害し、無断学習にかかるコストを増加させるために有効です。特に、「微小な変更」や「アドバーサリアルノイズの付与」といった手法は、見た目の品質に影響を与えずにモデルにノイズを持ち込むため、非常に効果的です。
こちらの続きです。
https://anond.hatelabo.jp/lucky-happy/20241115
Xは捨て垢ROM専に徹する決断をした人もここに含む。この決断をした人はAIはトドメに過ぎず数々の改悪(Ex:API制限とそれによる企業連携の停止、ブロック貫通、収益化による過激な発言やインプレゾンビの跋扈、5ちゃんみたいな不快な広告、いいね非公開(これ悲しむのネトストだけでは)、汚染されたおすすめ欄など)の積み重ねの末に痺れを切らしたパターンが多い。ただ「とりあえず移行先なら平気でしょ」とよく考えないで移ってる人も多い。各移行先の特徴をちゃんと把握しておくべきである。ブルスカはAI放置で外からの対策は無だぞ。丸ごと載せてこれなら大丈夫と思ってる奴が理解できない。でもリンクはXと違って怒られないからこっちに学習対策サイトに載せた絵のリンクを繋げておけ。
理由が「AIに学習されたくないから」ということでインスタやThreadsやTikTokに移るのは尚更理解に苦しむ。あそこ下手したらXよりAI学習用にユーザーのデータ好き勝手してるぞ。具体的に言ってないだけで。恐らく一番ダブスタと罵られやすいのはこういう人たち。
自分がなんで移行したいかについてはちゃんと考えて言語化しておくべき。ただの中身なき便乗だと思われるぞ。フォロワーのこと一方的に仲間だと思ってても向こうはそう思ってるわけじゃないからな。これを機に人間関係リセットも兼ねてるんだよ。
アカウントあるだけで残留組に都合いいところだけどXに寄生していると思われるので、決別を覚悟しながらX残留公式を追いたいなら誰にもバレないようにやろう。啖呵切っておいて実はやってましたとかダサい。情報収集程度ならいいがせめてアカウントセルフ凍結させておけ。
人が少ない環境でのびのびやりたいので向いている人と、反応が少なくて心が折れる人に分かれる。ただ知名度伸ばそうとするとすぐにいろんな層が入ってきて今のXみたいになるよ。Twitterだって黎明期はのんびりしてたじゃない。threadsのTLが地獄なのも流石にユーザー億抱えてたらこうなるんだよな。強制的におすすめ見せてくる理解が足りないUIのせいもあるが。
なんとなくだが、特にブルスカはCEOもその傾向にあるのか反イーロンとしてヘイトを溜めてる人が多い気がする。国内外問わず。既に居心地いい場所ではなくなってる。
AIを憎むなら一番あるべき姿。同居人や友人に裏切り者がいない限りAIに学習されることはまずない。 iPhoneのカメラロールからAppleに「品質向上目的で」データ抜かれてる可能性はあるが。外には漏らさないよって言ってくれてるけどそれすら嫌な人はスマホもやめてくれ。For youとかまさにAIの賜物だよね
ここまで徹底してるなら逆に好感度がある。承認欲求とは切り離された、「お客様は私だけ」という考えの人。イベントもオフでしか出さないし、絵のデータも絶対にローカル環境以外には出さない。信用できる人にしか紙頒布しない。LINEで友人に絵を送るときにも十分に警戒する。まさにどんな手段を使ってでも作品を守ろうとする筋の通った人たち。
裏を返せば新しいことに適応できない病的なテクノフォビアとも言えてしまうが。本当にAI学習されたくないならネットにしがみついてないでここまでやってくれ。対価も払わず中途半端にXの恩恵だけ受けようとしてるテイカー気質が気持ち悪いので。
SNSは気軽にできる場所だから決断も個人の自由だし一番守るべきなのは自分の精神だとは思うが、他人の心まで侵害してたり、自分を棚に上げた言動をしてないかについては今一度考える必要がある。
絵師の皆様方は、自分自身が本当に著作権違反に抵触しておらず、クリーンで清廉潔白な存在と胸を張って言えるのだろうか。
私は、そうは言えない。
何故なら二次創作はもちろん、昔はFC2でアニメ見てたし、明らかに黒に近いグレーな人力ボカロや音MADも見てゲラゲラ笑ってたし、淫夢本編も見たし、TikTokの流行りも特に否定してないし、ネットミームで遊んでるし、アニメのキャプチャ見て感想思い出してるし、クソコラが送られてきても(寒いなと思いつつも)特に咎めなかったし、夢の国チキンレースで面白がってたし、なんならmeituやmimic、copainterなどのAIツールに興味本位で触ったこともあるからだ。
それら全部やってません、もしくは足を洗いましたという人だけ石を投げる権利がある。考えは変わる。だが今もAIや知的財産権侵害の全てを批判する覚悟はあるか?何今更優等生ぶってるんだ?インターネットに身を置いた時点でお前はアングラなんだよ。
猫ミームとかまさしく権利侵害だよな?月曜が近いよbotとかまさか見てないよな?二次創作で半分版権キャラをオリキャラ化してないか?野獣先輩のことフリ素だと思ってないか?おとわっか削除(アレはネタバレで消されたが)で悲しんでないよな?
そういう余罪が明らかになった瞬間、AI批判の言葉は急速に説得力をなくす。例として、反AI活動をしてる漫画家が過去に出した同人誌で原作のコマをまるまるぶっこぬいてそのまま載せる(もはやトレスとかではない)蛮行が掘られたが、そういうのだ。今の心持ちがどうなのかわからないが現在の当人はその件について徹底的に無視を決め込んでる。タチが悪い。
これもきっとキャンセルカルチャーと言われてしまうのだろうが、そういった先鋭的な活動をするのであれば証拠隠滅と禊が基本ではないのか?
こんなんだから、結局自分さえ良ければ全部良くて他人の権利は平気で侵害する害悪ダブスタ呼ばわりされるんだよ。
もし本当にAI学習という権利侵害(実際学習だけなら権利侵害ではない)が嫌なのであれば、自分自身も権利侵害から手を引くべきなのではと思う。実際二次創作こそウォーターマークを!という発言に対して「いや、そもそも二次創作自体が黙認でどうにかなってるだけだよね?」ってツッコまれてたし。スクショのノイズかけとかも話題になってたけど逆に私物化甚だしいと思います。実際公式無加工画像上げてるじゃんね。そういうのにも凸るのか?凸ったから各所が声明出してるのね。
まぁ、思うよね。量とスピードと再現力が尋常じゃないもの。仮に映像記憶完全再現マンとかいたらどうなってたことやら。
男作れ男。女でもいい。
社畜になってもいい。楽しければ。くれぐれも体は壊すな。
さっきも言ったがフォロワー=味方でも友達でもないからな。お前のこと人生のスパイスだと思ってる程度だぞ。
今回で痛いほどわかっただろうが人はみんな基本自分のことしか考えてない。他人(それこそ家族も友達も推しもフォロワーもみんな)は自分の人生の踏み台に過ぎない。ただのネームドモブだ。認めろ。自他境界なんて最初からなかった。
みんなそう思ってるんだから誰もお前一人消えようが尊重しないしお前自身も誰も尊重してないことを自覚しろ。せめて(私の人生の彩を与えてくれる道具として)尊重してますぐらいにしとけ。
私も脱オタしてまともになった友人をたくさん見て悲しくなってた時があったが、今回の件でオタクがとんでもなく話の通じない化け物であることを痛感した。そんなことするぐらいならオタクなんか上がっちまえ。
なんなら自分自身が抜けられない化け物であることを分からせられて今かなりつらい。
普通の人はたかがネットでレスバなんかしないし漫画やアニメやゲームには触れても一般人の分際でクリエイター気取って吠えたりなんかしません。
日夜レスバを続けたり移行先準備に必死になってた人、現実世界での生活はいかがですか?
別にオタク趣味が認められてもオタクの生き様が認められたわけじゃないからね?
創作する趣味を持つとボケないとか言うけど、今回の君たちの振る舞いは耄碌老人とそう大差ないからね。
恋愛に夢中になればメインジャンル:彼氏になってAIどころか絵にもネットにも興味無くなる。
そんなの自分じゃない!と言いたくもなるだろう。
君たちがそんなに必死になるのはさっきも書いたが居場所がなくなるから、つまり依存先がイラストやネットにしかないからだ。
プロのイラストレーターは仕事≒趣味になっているところがあり(これはフリーランス全般的に共通するが)境界線が溶けかけてる人としっかり線引きして「万が一の移行先はここですよ〜」程度に留めてる人に分かれてるイメージがある。後者はたとえ失ったところで他の鎹が存在するぐらい強い基盤があるのだと思う。BL出版社所属の作家よ、上を振り回して恥ずかしくないのか?お前に忖度した上での決断だぞ。
逆に前者は仕事をもらってる立場でありながら視野が狭くなって周りが見えなくなり、自分のことしか考えられなくなった状態だと思われる。
依存先は増やしておけ。悪いことは言わないから。今騒いでる人たちなんか居場所は家(冷えてるし飽きてる)、職場(ビジネスライク)、Xしかないんだろ?だから奪われまいと喚く。
パンピの友達に今回のAI学習の件について学習経路も説明した上で聞いてみよう。大抵は「えー何それ面白そう便利そう」で終わると思う。オタクがTikTok嫌って陽キャが親しんでるように、あいつらは多分AIに肯定的だし技術に強い()君たちより先に使いこなす。そのうちインスタにi2iフィルターとか実装されるんじゃないのか?発狂だね。
実際一般人妹に標準カメラなんかじゃなくてビュープラ(ゴリゴリAI加工)で写真撮れよと怒られた。変なパックみたいなフィルターも使ってた。そんな認識だ。
まぁ、パンピもパンピでアレン様をロック画面にする因習が流行ってる時点で宗教的なものがないと生きられないのは変わらないか。
とにかく、認知の歪みは正しておいた方がいい。リアルの友達も類友しか集まらないようであればエコーチェンバーの治療はできないが。
先ほど氷河期が過激化しやすいと書いたが、年齢的には40〜50代あたりだ。ちょうど家族というものが冷めてくるし仕事でもポストオフでお荷物になる。だからって不倫はやめようね。
そうか、二次元に触れることで不倫欲を解消してたのか。おっさんが風俗行くのと同じように。
これを一般の非オタおばさんの場合ワイドショーを元にしたエッグい井戸端会議になる。あの年代は全体的に厄介だ。精神年齢が中学生レベルの悪口言うことしか癒しがない人たちばかりだ。自分が20年後ほどこれになると思うと末恐ろしい。早く死んでしまいたい。
自分の暴走の抑止力のために創作は機能してたんだね。それが失われちゃ、爆発するよね。ようやく理解した。適切な福祉が必要だ。好きなものを守るより加害することがメインになってるようであれば。
余談だが、AIに関して考えると元彼のことを思い出す。デート中に私のことよりも掲示板やオークションばかり見てて痺れを切らして別れた。一生ネットやってろオタクが。だから非モテなんだよ
それはさておき、彼はなかなか香ばしかった。
こうして見れば自分が侵害者であることを受け入れその通りに振る舞ってるが、シンプルに人間性の部分の合わなさが浮き彫りになって別れた。
みんなも交際相手のAIに関する価値観はチェックしておかないといずれ取り返しつかないことになります。
自分は男脳なんだなと思っていたが、いざ典型と関わるると腐っても女なんだなというのがわかって悲しくなった。理屈的にも感情的にもなれないので男とも女とも仲良くなれない。
しかし、これを見返すとAIを嫌がる人は絵を描く"過程"やイラストやオタ活によって形成された人間関係を重視しており、反面AIを活用する人は成果物さえできればそのルートはなんでもよく、技術そのものの発展や利便性を重視してる。見ているポイントが違うのだ。そりゃあ分かり合えない。
男は狩り、女は集落で家を守るの時代からなーーーーーんも変わってないね。こんなに技術が進んでも。遺伝子にそう刻み込まれてるのだろうか?
それに今回で騒いでるの日本人だけなんだよな。中韓の神絵師はだんまり。男性向けジャンルの男性絵師も比較的通常運転。ウォーターマークの有無が日本人とその他を分ける手段になるなんてな…
またこういうところで大陸クリエイターにシェアを奪われるのは、こんな感じに日本人絵師が日和って敗北を認めてしまうところにあるのかもしれない。GHQの教育が現代までしっかり生きてるね。
ともかく、くれぐれも付き合う人間関係は精査したほうがいい。
少なくとも倫理観や善悪の基準の合わない人間とは付き合ってはいけない。
今回の件も正直AIが技術がSNSがとかではなく、結局人間関係やお前個人の考え方の問題なんだ。
絵師もレスバマンも、早く大人になってください。心の子ども部屋から卒業してください。
おもちゃなんて、たまに懐かしむぐらいでいいんです。
まぁ、みんなでじわじわとXから抜けてアクティブアカウントを減らしていけば企業も自ずと移行先に移るだろうし、広告収入が足りずサービスとして成り立たなくなりいずれ本気で滅びる時がするから、その時期を待ちましょうや。
メルカリの件といい、アプリやサービスの存在価値がどんどん疑われる時代になっていくね。
前後編に至るほど長くなりましたが以上です。
そう思うようになったのは、日課のニジエ周回にて、神絵なので推していたアカウントが途中で投稿を止めてしまう例があまりに多いため。
pixivは周回しないからあっちでもそうなのかは分からないけど、ニジエってアカウントがエタって作品出なくなる率が異常に高いと思う。エロだからなのかもしれないし、他の投稿サイトだってそんなもんなのかもだけど。
で、FANZAやDLsiteやTwitterやFanboxなどに登録すらしてないニジエのアカウントも全然あるから困ってる。連絡が取れないと依頼DMすら投げようがないものね。
かといって、Skebなどで「この人の絵っぽく描いてください」というのは流石に尊厳破壊っぽさあるから、生成AIとやらで上手くやれないかなって……
例えば日本の漫画は社会問題や政治をあまり書かないって言われてるんだけど
そんなことはなくて、色んな問題を構造だけ抽出して、ファンタジーの皮を被せて世に出してるんだよね
表現の自由はあるものの、思ったより構造部分で悪人を美化する創作物って少ないんだよね
これは良かれと思ってやってるというより、現実問題を扱うと外野がうるさいからだよね
あと先入観が生じるし、漫画外の情報が入ってきて物語にノイズが交じるからという
だから「ここは地球に似たどこか」とか「別の世界線の話」とかの設定にする
でも一応その暗喩に気づきやすいようにもしている、あからさまというか
最近で言えばもちづきさんが巧妙でさー
たぶん作者はアル中の方が上手く書けるんだよね
なんなら読者がガチで見たいのはシャブ中の話かもしれない(前にそんな漫画流行りかけて流行りきれなかったな)
でもそれじゃ社会に受け入れられないから、ギリギリのラインで「ドカ食い」にしたらちょうどよくてハマったんだと思う(狙ってはないだろうけど)
◯◯中毒みたいなコントをやる時でも、絶対ありえないようなものを対象にする