はてなキーワード: 投稿サイトとは
想像してみよう
ちょっと推そうと思って「このXXってSFすげえ!神!」と書き込んだとする
そこに「いやXXは間違ってるから」」や「そのXXのアイデアは〇〇って作品の丸パクだから」と横やりが入る
また、なにより、気軽に「XXって神!」と気軽に騒ぐ層が「こういうツッコミをもらいやすいジャンルはビュー数稼ぎづらい」と学習する
読んで欲しいという欲望が抑えきれない作家は、少なくともランキング形式投稿サイトでは”SF”を書くのをやめる
SNS以前、10年前までなら、ネット経由の口コミはありえたと思う
もう編集者や出版社、批評家などのオールドメディア経由でないと露出が難しいのではないか
欧米の連綿たるメインカルチャーの伝統、教会や王権といった権威によって裏付けされたアカデミズムを前提として成立した科学主義を踏まえたインナーサークルに加入するという体裁が曲がりなりにもあって、それ踏まえた上での想像の自由を認めることで成立するジャンルなので
そのあたりを吹っ飛ばすスペースオペラが容認されるのも「こういうのを認めるのが伝統を維持する上で大事」という、カトリックの反宗教改革におけるバロック的演出の活用みたいな算段があるからで、バックに権威が控えてるのは同じ
近年、SNS上で表現規制に関する議論が活発化している。特にX(旧Twitter)では、議論の際に「BL作品は適切にゾーニングされている」という主張が頻出する。この主張に対して、書店の一般書棚で裸の男性が絡み合う表紙を持つBL作品が陳列されている画像が提示され反論される場面も少なくない。で、実際のところどれくらいゾーニング意識があるのか気になったので調べることにした。調査方法などおかしい部分があればご指摘頂きたい。
国内最大級のイラスト投稿サイトであるPixivを調査対象とした。Pixivには、投稿作品に対し元タイトル名やキャラクター名を含む多様なタグを設定できる機能があり、BL作品については一般ユーザの目に付かないよう「腐向け」タグを用いて棲み分けを行う文化がユーザー間で共有されている。この「腐向け」タグによる棲み分けが適切に機能しているかを確認するため、データを収集・分析した。
各対象作品について、Pixivの検索機能を用い、以下の2種類の検索結果を取得した。
一部の作品では、「腐向け」という標準的なタグではなく、作品タイトルをもじった特定作品用の腐向けタグが使用されている場合があり、これが存在する場合はそちらの検索件数を使用している。
収集したデータをもとに、腐向けタグが適切に使用されていない作品の割合を算出し、「BL棲み分け用タグの誤用に起因するゾーニングの不徹底度」を評価した。
以下30タイトルを対象に調査した結果は以下の通りである。順不同。
No. | 作品名 | 公式作品名タグ | 公式作品名タグ+腐向けタグ | ゾーニング不徹底度 |
1 | ONEPIECE | 204,824 | 3,905 | 2% |
2 | ドラゴンボール | 146,219 | 3,350 | 2% |
3 | NARUTO | 231,302 | 5,503 | 2% |
4 | ジョジョの奇妙な冒険 | 111,135 | 4,467 | 4% |
5 | 銀魂 | 199,358 | 9,746 | 5% |
6 | BLEACH | 98,259 | 2,076 | 2% |
7 | 呪術廻戦 | 128,377 | 5,682 | 4% |
8 | 僕のヒーローアカデミア | 146,071 | 3,272 | 2% |
9 | ハイキュー!! | 144,443 | 16,656 | 12% |
10 | ワールドトリガー | 33,049 | 1,964 | 6% |
11 | るろうに剣心 | 17,952 | 749 | 4% |
12 | テニスの王子様 | 128,133 | 4,809 | 4% |
13 | DEATH NOTE | 7,737 | 258 | 3% |
14 | チェンソーマン | 84,273 | 316 | 0% |
15 | 黒子のバスケ | 182,905 | 4,078 | 2% |
16 | 鬼滅の刃 | 272,769 | 6,769 | 2% |
17 | 家庭教師ヒットマンREBORN! | 20,903 | 864 | 4% |
18 | SKET DANCE | 5,204 | 345 | 7% |
19 | 北斗の拳 | 11,500 | 680 | 6% |
20 | マッシュル-MASHLE- | 5,071 | 188 | 4% |
21 | アンデッドアンラック | 2,308 | 1 | 0% |
22 | 夜桜さんちの大作戦 | 1,826 | 13 | 1% |
23 | Dr.STONE | 9,866 | 631 | 6% |
24 | HUNTER×HUNTER | 54,355 | 1,345 | 2% |
25 | ブラッククローバー | 8,538 | 164 | 2% |
26 | ヒカルの碁 | 6,084 | 368 | 6% |
27 | シティーハンター | 6,913 | 8 | 0% |
28 | アイシールド21 | 5,985 | 529 | 9% |
29 | 逃げ上手の若君 | 5,312 | 279 | 5% |
30 | 斉木楠雄のΨ難 | 6,756 | 527 | 8% |
最大で12%の確率で腐向け作品を見る可能性がある。正直数字としてちょっと高いと思う。
だいたい同意。素敵。
「作家の個性」ではあるのだが、読み手の想像や共感に委ねられてしまう、一度世に出ると陳腐化してしまう、言葉(文章表現)の変化速度は他のジャンルに比べてあまりにも早い(試行が楽)。
などの理由から、そこにこだわる意味を見いだせてないのではないか
五段階評価ぐらいなら秒でできる絵と比べて、評価に時間かかる、対象者も少ないのもある
もちろん「炎の熱さ」みたいな単純ではないことの例えなんだろうけど、どっちにしても一緒な気がする
検証した結果があってまとまったものを教えてくれたらよいのにと思う気持ちもわかるが、
それは結局「作品」より「技術」に必要なこと寄りで、作品を生み出す能力の一部なんじゃなかろうか渡り廊下
習わんでも駄文なら書ける人多いしね
とりあえず、作品発掘は
投稿サイト、SNSでの読者選考(運任せ、作者負担、ファン投票)
選考料とる
とかとかでどこに落ち着くのかなぁ
課金レースとかと相性悪いし、課金レース自体も非難多いし、互助会やらもやり方間違えるとだし
> 「作品」を完成させることだけを重視し
作家を探す系のコンテストも色々あったが流行らんかったし。漫画もそうだけど、作品ごとのムラが大きくて……コンスタントに良い作品を残せるほどでもない書き手の作品が世に出るのは良いことでもあるのか
そもそもの話、X社は画像生成AIなど作っていない。彼らがつくっているのは検索支援AI Grok。学習に使いたいのはテキストの方であって画像ではない。
わかりやすさのために ChatGPTと比較してみる。2023年にリリースされた GPT-4 に試しに今期のアニメについて質問してみよう。
今期最も人気のアニメはなんですか?
ChatGPT:
2024年の今期で人気のアニメはいくつかありますが、「進撃の巨人」や「呪術廻戦」が特に注目を集めています。また、新作では「東京リベンジャーズ」や「スパイファミリー」も話題です。どの作品に興味がありますか?
アニメに詳しい人ならちょっと古い話をしているのがわかるだろう。 GPT-4 が学習を行なったのは2023年までの情報だ。なので最新の話題に対応できないのである。
一方、Grok は Xの投稿をリアルタイムに検索して反映する。もし Grok で同じ質問をすればダンダダンやリゼロ、ブリーチ辺りの話をするはずだ。つまり、Xが収集したいのは「ダンダダンの7話泣かされたわ・・・」みたいな投稿のことであってイラストではない。
Grokには画像生成機能がついているが、これは自前の物ではなく Black Forest Labs社 の FLUX.1 というモデルである。X社が Xに投稿されたイラストを収集して学習させているわけではないのだ。それでは FLUX.1 の訓練に使ったのはどこの画像なのだろうか?データセットは明らかにされていないが十中八九使っていそうなのが LAION-5B である
現在大手の企業は「著作権的にクリーンな」画像生成AIをつくっているが実際には版権物が出てくることが知られている。なぜそんなことが起こるのだろうか?
このからくりは LAION のデータセットにある。LAIONはドイツにある非営利組織。ネット上のありとあらゆる画像を収集しタグをつけたデータセットを公開している。
A. LAIONは非営利の研究組織です。ドイツの著作権法(§60d UrhG)に従いあらゆる著作物の利用が許されています。
とあるようにドイツの法律上合法である。実際に訴えられた後LAION側が勝訴している。とはいえこの組織にはAI関連企業からの多額の寄付金があることが知られており、パチンコ3店方式のような意味合いでの合法とも言える。
尚、反AIさんと反々AIさんが著作権法第30条の4を巡って喧嘩をしていますが、世界では日本の法律は関係ないです。いちおう念の為。
他の絵師さんに Glaze を使うように詰め寄ったり、使わないやつはAIに加担していると攻撃したり。挙げ句の果てには「自分の絵にGrazeをかけました」と宣言したり。
もう、全てが間違っている
そもそも、Glaze も Nightshade もAI学習を阻害するものではない。学習したモデルをぶっ壊す毒なのである(poisoned って書いてあるでしょう?!)
相手に食わせなければ意味がないんだ。Glazeかけたとか自分で言うな。対策されるでしょう?(後述)
それと他の人に強要する意味はない。使いたい人が使えば十分なんだ。
事実すでに効果は上がっていてOpenAIは悲鳴をあげ対策を急いでいる。
反AIさんの考えるよりも Glaze/Nightshade はずっと強力だ。それはデータセットを汚染する攻撃である。簡単に言えば Nightshadeは「学習中に他の絵に変換されてしまう」ノイズをかける。この操作を毒入り(poisoned)と呼ぶ。ピクセル毎の微小な変更なので Nightshade をかけた後もイラストはぱっと見はかわらない。
Nightshadeを使って例えば 犬の画像を猫の画像になるノイズをかけたとする。するとAIは犬と猫が混ざったまま学習を進め「犬」と言う概念が無茶苦茶になってしまう。
図:毒入りモデルの変化 (arXiv:2310.13828から引用)
上の図は毒入りの画像を200枚食わせたときの変化の様子だ。犬が猫になってしまっている。それだけではなく”犬”に近い概念、”子犬”、”ハスキー”、”狼”もぐちゃぐちゃになっている。
図:毒入り枚数による変化 (同引用)
こちらは50、100、300、と毒入り枚数を変化させたときの様子。50枚の時点ですでにめちゃくちゃになっている。
もし私が反AIだったなら、イラストに Nightshadeをかけて danbooru に投稿するだろう。二次元イラスト特化の画像生成AIはdanbooru2021/ danbooru2022 などのデータセットを使っているものと見られる。これらはイラスト投稿サイトdanbooru から収集したものである。
ところで Glaze も Nightshade もその内部で画像生成AIを使っているということを知ったら反AIさんはどんな顔をするだろう?
Glaze は特徴量抽出を行う。おそらく Stable Diffusion の VAE(Variational Autoencoder)を使っている。そしてNightshade の方も 内部ではStable Diffusion 等の画像生成モデルを用いて別の画像を生成する。
Glaze が機能しない?あるいは解毒方法が見つかったかもしれない
上のスレッドのコメント欄では Glaze が論文のようには機能しないことについて議論され「画像のリサイズをしたのではないか」と予想している。Glazeをかけた後に画像を縮小、データが圧縮されてノイズ効果が消えたのではないかということだ。
A) 絵師さんが Glaze をかけたあと画像を縮小した可能性
B) 画像サイズやファイルタイプによってはプラットフォーム側が勝手に加工をする
C) 学習の際にリサイズを行う (Stable Difusion XL では1024px, 古いモデルは512px)
A,B については絵師さん側に知識があれば対処可能だけれども C の方はなんともし難い。小さい画像を投稿したところで [縮小→拡大] でノイズは落とせそうだ(解像度は悪くなるだろうが)
LAIONは収集画像そのものを所有せず、データセットはウェブ上にある画像のurlとタグをまとめた物であるらしい。
ということは、LAIONの新しいデータセットが公開されたタイミングで画像のurlを変更すれば学習に使われることを回避できそうだ。特に、個人サイト/ブログの所有者ならば古い url に●んこ画像でも差し替えておけば嫌がらせになる。(タグ差し替えはこのグラフの Simple Attak に相当)
90年代においては画像に直リンクされたときの報復としてうん●画像に差し替えたものです。まさか令和になっても有効とはね
この記事をぼちぼち書いているいるうちに2日が経過した。今、私のXのタイムラインもおすすめもとても静かだ。攻撃的な人たちやデマに流されやすい人達は皆どこかに行ってしまったようだ。残ったのはこれまで静かにイラストを描き続けてきた人たちでとても穏やかな空気が流れている。ずっとこのままがいい。
そう思うようになったのは、日課のニジエ周回にて、神絵なので推していたアカウントが途中で投稿を止めてしまう例があまりに多いため。
pixivは周回しないからあっちでもそうなのかは分からないけど、ニジエってアカウントがエタって作品出なくなる率が異常に高いと思う。エロだからなのかもしれないし、他の投稿サイトだってそんなもんなのかもだけど。
で、FANZAやDLsiteやTwitterやFanboxなどに登録すらしてないニジエのアカウントも全然あるから困ってる。連絡が取れないと依頼DMすら投げようがないものね。
かといって、Skebなどで「この人の絵っぽく描いてください」というのは流石に尊厳破壊っぽさあるから、生成AIとやらで上手くやれないかなって……
できるよ!!
公開範囲を限定するのそれなりに効果はあるけれど100%ではないよ。
…例えば物理Onlyでかつ有償でのみ閲覧可にしてもネタ画像と称して漫画のコマを切り抜きしてtweetする人がいるように
Glaze も学習妨害の効果はあるけれど100%ではないよ。
…Glazeの仕組みは他人の画風と混ぜ混ぜして学習をだます仕組みだけれど、Glazeは、学習に使用するモデルと妨害したい画像データ、欺瞞用データで計算するため 計算に使用したモデルに対してのみにしか妨害効果がないから、適用範囲が限られてるよ。そのうえ、GlazeはSD1.5で動作するように設計されてるけれど、現時点でSD1.5を使用している人はほとんどいないよ。さらに、SD1.5の時代においても、ユーザーは各自のニーズに合わせてファインチューニングされたモデルを使っていて、素のSD1.5そのままを利用している人はほぼいないよ。加えて、素のSD1.5に対しても、効果のある元データと欺瞞データの組み合わせの幅が狭く、常に効果があるわけではないよ。…論文は正しいしアプリもそれなりに動くけれど前提が現実に合っていないの
Nightshadeも学習妨害の効果はあるけれど100%ではないよ。
…Nightshadeの仕組みは大規模モデルではトークンと画像の特徴の結びつきが弱いから簡単に乗っ取れるよなの。スタバなうでラーメンが出る現象みたいなやつ。論文では画像をWEBで公開する時は画像と関係ないテキストをつけろと言ってるけれど、そんなことしたら意味不明なツイートになったり、画像投稿サイトにUPしても見つけてもらえなくなるから誰も実践してないの。Nightshadeのアプリは画像から画像の説明を生成するアプリを騙す処理を施すのであって学習を妨害する機能は無いよ。しかも実際は全然騙せていないのん。それに、学習する側はNightshadeとは関係なしに説明文の生成で誤検出等があるのが前提で手動で画像の説明文を修正するのが当たり前だから…論文で言ってることは正しいけれど誰も実践できてないの
…「この画像はウォーターマークのついている画像です」の説明文とともにウォーターマークごと学習して、ウォーターマークの画像の特徴はウォーターマークのトークンに関連付けられて学習されるの。ウォーターマーク以外の部分はその他のトークンに学習されるの。ウォーターマーク付きのデータが増えると、より正確にウォーターマークの概念を学習できるの。
ウォーターマークは学習妨害ではなく当該著作物の2次利用の防止のためにつけるものなの。例えば、勝手にグッズにされたとか
ウォーターマークがついていない本商品を売るためにサンプルとしての参考画像にウォーターマークをつけるの。本商品にまでウォーターマークつけるとウォーターマークついた状態で2次利用されてしまうの。
…ウォーターマークと同様にサインのトークンに吸収されて学習されるの。
要するに「ウォーターマークを入れると強い意思表示になる」「機械学習も妨害できる」という触れ込みらしい。
ぶっちゃけGlazeやNightShadeなどと同じく「それが効く根拠は?」で終わってしまう話だと思う。
鰯の頭も信心から、というにはちょっと美化しすぎて、ぶっちゃけアホ行為の類いだと思う。
ただ個人的に、キャラと被らないように or 薄めに適用されるウォーターマークは、イラスト鑑賞する消費者視点で見ると「まだ許せる」感が強い。
描いた人のペンネームやTwitterアカウントを「サイン」として紛れ込ませるって手法は、作者を証明する手段として昔からあったから慣れてるしね。
明らかに絵を劣化させるGlazeやNightShadeを「あまり劣化しない!」とか言って嬉々として適用する絵師の眼力がちょっと信じられなかったから。
補足:
自分は、ツールをインストールして触ったり、Webサイトで生成して遊んだことは (記憶している限りで) ないし、Adobeのジェネレーティブ塗りつぶしも写真の微修正にしか使ってない。
現状の画像生成AIの最大の問題は、「無断生成」だの「絵師の仕事を奪う」だのじゃなくて、「ポン出しだとディティールやパースなどがガバってて見れば分かってしまう」ことだと思う。
なまじ「見れば分かる程度に違和感がある」、つまり「下手クソ」だから「画像生成AIなんてチャチなもん使うな」ってキレている人は実は多いんじゃないかなって……。
ただ生成時間は人間が描くより早いせいか、粗製濫造でDL販売サイトや画像投稿サイトやコミッションサイトなどが荒らされてやべーって感覚。
これはプロではない人の自語り。
X(旧Twitter)「投稿したモノはAI学習に使っていいってことなんで、勝手に使うわ!」(超要約)。
ということで改めてネットにイラストや作品を上げることについて話題になっている。前からその機能はあったが、設定でOFFにできた。それすらなくなるらしい。
増田は完全創作でイラストを投稿している。AI学習に無断で使われてしまうのはネットに投稿する以上、仕方のない事だと思っており、なるべくサインやウォーターマークを記載したり、無断使用禁止を明記はしている。
XはTwitter時代、2010年ごろから始めていた。今からしたらド下手で小学生の落書き未満の画力だったが無断転載はあった。でも自分はそんな奴に絡んでいく必要性もなければ、まだネット上の無断転載を罰する意識も特に無かった。そのため基本放置で、自然消滅を待っていた。カス野郎だなとは思っていた。
だから「ネットに投稿=無礼者が勝手に使う」という意識は昔からある。ネットのデメリットとして当然だと思って無視を貫いていた。
増田と絡んでくれる人、応援してくれる人は両手で数えるくらいしかいないけど、その人たちはなりすましも静かに報告してくれたし無断転載には反応していなかった。
Twitterを始めてからネット浸りで、投稿数も多く、それもあって無断転載されまくりだった。
だけどネットだと気軽に閲覧数が増える。フォローしてくれる人もいる。毎回絵にふぁぼ(いいね)してくれる人もいた。その数字が気持ちよかった時期もあった。
でも、リアルイベント(コミティアなど)に出るようになってからはTwitterやネットからは徐々に離れるようになった。投稿するのは宣伝やちょとした絵と落書きだけ。それから無断転載は減った気がする。
リアルイベントの宣伝はいつも3RT2いいねくらいで「そんなに人来ないかな」と思っていたが、実際は数十人は来るし、売り上げ的にリアルで通りがかった人が買う場合が8割だ。そこからまたイベントに参加するとまた来てくれたりする。それは本当に嬉しい。
リアルイベントでイラストを発表しても無断転載AI学習はなくならないが、自動で取られることはないし、現地に来ないと意味がないので多少は防げる。(めちゃくちゃ最悪な話、金払っているならまぁ…という心持ちにはなる。それでも嫌だが)
リアルイベントの場合、買ってくれたファンに直接「ありがとうございます」が言えるのが利点だ。
だから今回の話題も正直今更感はある。とりあえずXに停滞し続けると、AI学習に賛同している人間だと思われるので、それが嫌で離れるつもりではいる。だが、いかんせんSNSで宣伝力が強いのは現状Xになる。インスタはちょっと趣向が違うので宣伝力があまりない。といってもリアルイベントでは通りすがりが購入の9割くらいなのでネットなんてしなければいいのかもしれない。宣伝とかそんなものこんな一個人の力じゃ大して宣伝にもならない。もっともフォロワーが1万人越えだったら別だろうが、それ以下は宣伝したって大して変わらん。
自分のHPを作って、クロスフォリオみたいにBot対策している投稿サイトにあげる程度でいいのかもしれない。
前まで気が付けばTwitterを毎時間開いていたが、そんな意識になってからはXは週に2時間程度にしか開かない。
リアルで生きればいいかと思うようになってきた。無断でAI学習されるのはムカつくし、著作権どうなってんだよ、他人のふんどしで稼いでんじゃねーよカスって意識だが(増田は二次創作で稼ぐ人もあまり好いていない。赤字かトントンでいろやアホそれが常識じゃなかったのか)、今はそれを罰するのも面倒だ。
AI学習に勝手に使われるのは仕方がないし、避けられないが、その無断AI学習という行為に賛同はしたくないという人は多いと思う。
ネットから離れて、リアルイベントくらいでしか同人誌や作品を発表できなくなるような時代に戻るのが一番いいのかもしれない。色紙受け付けていますって、アナログに戻るのもいいだろう。
プロになりたいのならネット上で苦しみながら活動しておこぼれを貰うんじゃなくて、ちゃんと就活でポートフォリオ作って乗り込むようにすればいいじゃない。賞に応募しまくればいいじゃない。少なくとも昔はそうだったんだし。
そうするとネットという広い場所で宣伝できずに、みてくれる人や可能性は減ると思うが…でも自分のHPの宣伝程度でもファンは付くし、それでもいいんじゃないかな。それこそコンテストに出て知名度を得るとか、個展を開いて活動するとか、いろいろある。ネットという便利だった物が絵描きに優しく無くなるのなら、自分の足で発表するのが一番の防衛だし、やっぱりリアル交流は楽しいよ。何のための体だよ。
重ねてになるが、リアルのみの発表だったとしても無断でAI学習されるかもしれない。いや、されるだろう。それでもネットにポンポン上げるよりかは多少の防衛になるんじゃないかな。しょうがない。だって無断でAI学習させている人間に「やめてください」なんて言ったって聞く耳を持つわけがない。
万引きしている人間に「万引きやめてください」って言ったって大体は言うことを聞かない。なら万引きGメンを雇うとか、巡回を強化するなどこちら側が変わらないといけない。それでも万引きは無くならないのと一緒。万引きする奴は店の事情なんて知らない。むしろ店側を文句を言ってくるウザイ存在でしかない。
そんな風に、ネット投稿の意識やルールをこちら側が変えないといけない。面倒だけどさ。
はっ!もしかしたらXくんはネットに依存しすぎた絵描きをネットから解放しようとして……はないか。
昔を思えば、小学生のころから誰かに褒められるでなくずっと描き続けていたことだし、絵を見せ合っていたリア友は2人くらいしかいない。
ポンポン手軽に奪われてしまうネットをやめることで何万人の無言閲覧者を失っても、リアルで「いい作品ですね」「素敵ですね」ってたった一人から貰えるだけで本当は満足するべきなんだと思う。感想を一言言ううも買わなかった人もいる。だが構わない。初心はそうだったはずなんだ。実際何万の閲覧数より、一言の感想の方が嬉しい。なんでもすべて数値として出てしまうネットで、いろいろ変な思考になっていたんだ。気が付かないだけできっと疲弊していたんだ。
ちなみにコミティア150は11月17(日)ビックサイトで開催!個人の文化祭!
増田も出ているぞ!何があるか歩き回るのが面倒?そんなあなたに見本誌コーナー!それに現場はネット活動を一切していない人もたくさんいて、一期一会の快感が得られるぞ!絵だけじゃなくて食品サンプルだってお手軽に買えちゃうぜ!前回は手縫いポーチと手作りアロマ置きを買ったぜ!行けるなら行こう!そして一目惚れしたら「素敵な作品ですね」と声をかけよう!増田はそうしている。
1.一般的に言われるAIは、狭義のAIすなわち完全自律自己成長型人工知能の事ではないよ
2.これをAIと認めないなら AI Act 筆頭に人工知能を対象とした規制は「生成AIはAIじゃないんで関係ないね」になるよ
3.「生成AI」はホニャララ生成モデルを包括した用語だから、当たり前に使ってる機能が実は生成AIに該当するという事もよくあるよ
1.テキストを入力したら入力通りの画像が生成表示されるText-to-Imageの様子を検索エンジンになぞらえただけのものだよ
2.本気で生成AIはAIじゃなくて検索エンジンだと思ってるのは君だけだよ
1.そういうのもあるし、そうじゃないものもあるよ
2.極端な話、個人のゲーミングパソコンで動く程度のAIはネットワーク不要だと思って差し支えないよ
3.ただ、ChatGPTのようなクローズドモデルはそもそもユーザーがモデル本体を自由に扱えないから、ネット環境がないと使えないよ
4.そうではないモデル、例えばLlamaはモデルが公開されているから、動かせる性能のコンピュータがあって生成環境が整っていれば使えるよ
1.今どきの生成AIはテキスト入力するやつだけじゃなくて色んなのがあるよ テキストは出力をガイドするために使う手段の一つだよ
例えばテキストの場合、テキストからテキストを生成するのはText-to-text、テキストから音声はText-to-speech、音楽はText-to-musicのように色々あるよ
画像を入力に使うものは大体Image-to-****って言うよ
4.最近は複数の形式を同時に処理できるマルチモーダルモデルも盛況だよ
1.特定の絵柄に寄せて生成された画像じゃない限り、元の絵師は存在しないよ
2.例えば特定の画家の絵柄で、その画家が描いたことのない表現Bを描かせたAIイラストは巷に溢れてるよね
同じように、誰とも言い難い絵柄でBを描けるよ
1.コラージュのようなものだと単純化するのはいいけど、実際はコラージュじゃない*から注意が必要だよ
*補足:『実際はコラージュじゃない』けど、「どう見てもコラージュにしか見えない」ものが生成される事はあるよ これは全ての生成物がコラージュだ、という話ではないよ
2.人間の学習とAIの学習は同じみたいな話だよ 概念に共通部分を見いだせる以上でも以下でもないよ
1.推奨はしてるけど限定ではないよ 研究目的を推奨してる理由はLaion 5B自体が最低限のフィルタリングしかしていない闇鍋だからだよ
2.Laion 5Bを使うとしても、普通はそこから目的に合わせてフィルタリングした別のデータセットを作成するよ
1.Laion 5Bは画像へのリンクとキャプション集で、画像は含まれてないよ
2.何十億もの画像へのリンクが含まれ、その中には著作物のリンクが大量にあり、CSAMにアクセスできるものも含まれていた という所までは客観的な事実だよ
1.CSAMの判定は日本で言う児童ポルノとはかなり差異があるよ
2.日本でエロ同人やエロ創作を頒布してるような作家の大半が逮捕されるくらいCSAM判定が厳しい国もあるよ
3.ここは日本だよ
1.多様なイラストを生成できるのは多様なイラストを学習しているからという理由が大きくて、それを「データセットのおかげ」と言うのは厳密には間違いではないよ
ただ「データセット」には画像以外のデータも含まれるから、これを言いたい場合は「イラストのおかげ」と言うのがいいよ
詳細が公開されている画像生成AIの場合、学習に使われた画像は初期に公開されたモデルが最も多いけど、学習している画像が減った最近のAIのほうが明らかに高性能*だよね
それは生成係と人間とを橋渡しする通訳係の性能向上や、学習の仕方の研究が進んでいるからだよ
*補足:何をもって高性能とするかは諸説あるけど、ここではプロンプト忠実度や表現力、質の高さなどを評価対象とするよ
1.その判断が出たアメリカでも、生成AI使ってるから著作権なしなんていう暴論は文章が読めない人しか言ってないよ
2.外国を持ち出すと、例えば中国ではテキストから生成したAI画像に著作物性が認められてAI画像の転載を著作権侵害とした裁判例が出てるよ
転載者が作者のクレジットを除去してたことで、氏名表示権の侵害も認められたよ
つまり調整と選択を人間が繰り返したAI画像は、AIを道具として使った人間による創作意図あり創作的寄与ありの著作物と認定されたということだよ
アメリカより中国の方が日本と近い判断基準で考え方にも合致してるから、日本でもAI画像に著作権があると見なすべきだよ
っていうことにもなるね
3.人間の手で自ら苦労して作った創作でも、最小限度の創造性や独自性がないと判断されて著作物性が認められない事もあるくらいケースバイケースなのが著作権だよ
4.どのAI画像は著作権で保護され、どのAI画像が著作権で保護されないのか外野から分からないのだから、とりあえず大抵のものは著作権があるものとして扱うのが安全だよ
君がAI画像に著作権は無いと言ってたのを信じて転載した人が著作権侵害で訴えられても、責任取れないよね
5.ここは日本だよ
1.要は国次第だよ
1.トラブル回避を目的として転載や二次利用を制限している人は全く珍しくないよ 君達の行いを考えよう
2.自分が丹精込めて作ったものが勝手に使われて嫌…という気持ちだけじゃないことは君なら分かるはずだよ
3.AI絵師が皆「バンバン転載してください!」って言ってる方が、今以上にAIだらけの環境になるから大変だよ
4.著作権の有無に拘らず、AI絵の転載や無断使用禁止を宣言するのはむしろ奨励すべきことだよ
5.それでいて著作権法の権利制限規定の影響を受けるのはみんな同じだよ
1.僭称ではなく「偽称」や「詐称」の方が正確だけど、意図は分かるからここでは横に置くよ
2.僭称とは、相応しくない身分を偽ることだよ そこから手描きと機械生成の区分を偽ることとして使われだしたよ
3.偽る、つまりAI絵を手描きだと自称するようなこと以外は僭称と言い難いよ
4.「パッと見で手描きかと思ったらAIだった」とか「AIだけどAIタグつけてない」などは僭称を意味しないよ
5.『「AIだけどAIタグつけてない」などは僭称を意味しないよ』 とは言ったけど、それはAIタグをつけなくてもいいプラットフォームに限るよ
6.騙すつもりで表記してないんだーとかまで言っちゃうと、君が処される可能性が出てくるからやめたほうがいいよ
1.君の規制論を適用すると二次創作にも被弾するよっていう程度の話だよ
2.AI使いへ言葉を選ばずに心無いツッコミをすると人間絵師にも流れ弾が当たるのと同じようなことだよ
3.反AIに本物の表現規制派が紛れてるのと一緒で、ちょこちょこ本物の二次創作アンチも参戦してるから注意が必要だよ
1.文字通りの反AIという意味で君を反AI扱いしてる人はほとんどいないよ
2.この呼称はAnti AIという単純なシンボルを、集団で連日投稿サイトに上げてた反生成AIの先輩たちによる努力の証だよ
1.君が無断学習に反対してるだけじゃないことは皆分かってるよ*
2.普段どんな事を言ってるか、何に賛同しているか、どんな呟きに共感しているかは意外と見られてるよ
*補足:本当に無断学習をどうにかしてほしいだけの人を反AIとは言っていないし言うべきでもないよ
1.『当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させること』は、生成するから享受だーなんていう単純な話じゃないよ
2.享受という言葉が生成物に関わる時は、まさにその学習に使われた当該著作物を見た時と同様の知的又は精神的欲求を満たせるか、が重要なポイントになる時だよ
3.一番考えやすいのは、既に著作物だと認められている特定キャラクターが表現されている画像データで学習したLoRAを作成する場合、いわゆるキャラクターLoRAについてだよ
まず1. もちろん学習しただけでは学習元の著作物を享受できないから関係ないね
そして2. LoRAを生成に使用したとしても、無関係な画像を生成する場合には学習元の著作物は享受はできないね
*補足:LoRAとは言っても出力を特定の方向に誘導するために使うものだから、例えばマイナス方向に適用すると学習データの特徴とは離れるし、LoRA無しの場合と比べて微妙に変化が加わる程度に適用することもできるし、LoRA同士を混ぜたり引いたりできるし、色々な使い方があるよ
最後に3. 学習させたキャラクターを再現したり、部分的に改変したキャラクターを生成するための利用
*補足:学習した人と利用した人が別だと、考えることが増えるよ
そうしてやっと、作られた画像のデキ次第で類似性バトルが始まるよ ここがいわゆる「手描きと一緒」とされる部分だよ
この場合の「類似性」は法律基準であって、トレパク警察のように認定されるものではないよ
4.事前学習モデルの副産物として特定著作物の本質的特徴を再現できる場合は、AIで生成させるサービスの提供者が該当キーワードのブロックや置換などの技術的な措置を取り、普通の利用者*が生成できないように対策すべき、というのは国際的なコンセンサスが取れつつあるよ
*補足:文字列を一部書き換えたり入れ替えたり、なんとか規制を潜って生成しようとするのは「Obfuscation」という攻撃手法の一種で、こういう事をする人は「普通の利用者」とは認められないよ
2.言葉遣いが丁寧だから問題ない、悪いからアウトじゃなくて、振る舞いを総合的に判断されるよ
3.どうしてもやりたいなら自覚と責任を持ってやるんだよ そんなつもりじゃなかった、は通用しないからね
1.ディープフェイクとは、深層学習=ディープラーニングと偽物=フェイクをあわせた造語で、深層学習を利用した現実に存在しない画像や映像のことだよ
生成系AIによる生成物も「深層学習モデルで生成された、これまでに存在しなかったメディア」だよ
2.このうち、実在対象をヌードにするなどのポルノグラフィを特に、ディープフェイクポルノやフェイクポルノと言うよ フェイクポルノは、深層学習でないものも含むよ
3.言うまでもないけどフェイクポルノを公開すると法に触れる可能性が高くて、既に判例もあるんだ
生成AIを使わなければいいなどという事もないよ
4.どの法律で罰せられるか、どんな法律違反になるかは内容によるよ 主に名誉毀損、肖像権、プライバシー、わいせつ物陳列、著作権、パブリシティ権だよ
5.よく「取り締まる法律がない」というけど、それはフェイクポルノの作成自体を罰する法律がない という意味で、基本的に世論を煽る目的で言われるよ
6.作れるからというだけでツールを取り締まるのは難しいけど、フェイクポルノ作成を売りにしているくらいまで行くとチャンスはありそうだよ
「作れる」の規制が簡単にできない理由は、厳密に範囲を指定しないとコンテンツ製作に使われる顔変更やボイスチェンジャーの他、様々なツールも対象になってしまうからだよ
またなんか思いついて気が向いたら続きを書くよ
mysqlレベルのものを使って会社潰れるは、自分には使いこなせません言ってるようなものなのに、
よく自分の技術力のなさを技術記事投稿サイトで偉そうにひけらかせるなと思ってた
こういうのが出てきたら叩くのがはてな界隈だろうになぜか賛成の声が多くて驚いてた
匿名投稿サイトの書き込みをChatGPTにコピーアンドペーストし、その返答を当該書き込みに対するレスポンスとしてコピーアンドペーストするユーザーがいます。
これについてどのように考えますか?
匿名投稿サイトにおいて、他人の書き込みをAIに解析させ、その返答をそのままサイトに投稿する行為にはいくつかの側面があります。
意見の正当性と独自性: AIを使って生成された意見は、元の書き込み者の考えや感情が反映されていないことが多いため、議論において独自性や個人的な意見の正当性を欠く可能性があります。これにより、掲示板の本来の目的である意見交換や討論の質が損なわれることがあります。
匿名性と責任の問題: 匿名投稿サイトでは、書き込みの内容に対する責任を負うことが難しいため、AIによる書き込みも同様に無責任な発言と見なされる可能性があります。これが過度に否定的な意見を助長し、コミュニティの健全性を損なうことも考えられます。
AIの誤解や偏見: AIが生成する意見は、そのトレーニングデータやアルゴリズムに依存しており、時には誤解や偏見を含むことがあります。これが原因で、投稿内容が不適切または誤った情報を伝えるリスクもあります。
コミュニケーションの希薄化: AIを介したやり取りは、人間同士のコミュニケーションの深さやニュアンスが失われる可能性があり、結果として議論が表面的なものになることがあります。
総じて、AIを利用した書き込みは、その場の文脈や意図を十分に理解しないまま行われることがあり、その結果、議論の質が低下する可能性があります。そのため、掲示板での意見交換では、できるだけ個人の考えを自らの言葉で表現することが重要だと思います。
そのような行為を行う人間は言語化能力と主体性、社交性が低いと考えられますか?
そのような行為を行う人に対して、言語化能力や主体性、社交性が低いと感じるのは理解できる意見です。AIに頼って意見を述べることで、自分の考えをしっかりと表現する力や他者との直接的なコミュニケーションを避けているように見えるかもしれません。その結果、賢明さや成熟度に欠ける印象を与えることもあるでしょう。
ただし、その人がなぜAIに頼るのかについての背景や理由を理解することも重要です。もしかしたら、自己表現に自信がない、あるいは議論に参加する際にサポートが必要だと感じているのかもしれません。したがって、一概にその行為を否定的に評価するのではなく、背景を考慮する余地もあるかと思います。
このやり取りを匿名投稿サイトに書き込むとしたら、それについてあなたはどのように考えますか。
このやり取りを匿名投稿サイトに書き込むことについては、いくつかの観点から考えることができます。
1. 議論の質に対する影響
このやり取りがサイトに書き込まれることで、他のユーザーが議論に参加するきっかけになるかもしれません。AIを使ったやり取りについてのメタ的な議論が生まれる可能性もあります。
しかし、書き込みの文脈によっては、こうしたAIとの対話をそのまま投稿することが、他のユーザーにとって不自然に感じられる場合もあり、議論の流れやトーンに影響を与える可能性があります。
2. 透明性とオープン性
AIの意見を取り入れていることを明示せずに投稿すると、他のユーザーがその意見を純粋に人間の意見として受け取るかもしれません。この場合、透明性が欠けることになります。
逆に、AIとのやり取りであることを明示して投稿するなら、他のユーザーがそれをどう受け取るか、オープンな議論が生まれる可能性もあります。
3. 倫理的な側面
AIを使った意見表明が、サイトでのコミュニケーションや意見交換にどのような影響を及ぼすかについての倫理的な考察が必要です。AIに頼ることで、自分の意見や感情が薄れてしまう可能性もあります。
もしこのやり取りをサイトに書き込む意図が、他者との議論や意見交換を促進することにあるならば、それは建設的な行為として評価できるかもしれません。
しかし、単にAIを使ったという事実を他者に見せるためだけであれば、それがサイトの目的や雰囲気に合っているかどうかを考える必要があります。
総じて、このやり取りを匿名投稿サイトに書き込むこと自体が良いか悪いかは、文脈や目的次第です。サイトのルールや文化に則り、他者への影響や議論の質を考慮した上で行動することが重要です。
趣味のイベントで知り合ってたまにメッセージのやり取りをする程度の仲になった人が、
「(その趣味の)大手の投稿サイトから、自分は理不尽にアカウントBANされた」
と言うので、
「あれ? あのサイトの運営ってそんな理不尽な裁定を下す人だったっけ?」
と疑問に思って、その人がBANされた時期の他のユーザーの投稿を眺めていたら(運営は個々の裁定に関していちいち詳細を説明しないので)、
「その趣味の界隈では荒れるネタだから言及するな」とサイト規約に明記されている話題を他のユーザーから指摘されても止めず、
「この話題はサイト規約のとは別の話題だから問題無い」 「同じ話題を投稿している人が他にもいるのに自分だけ攻撃されている」 「自分にはしつこく攻撃してくる集団アンチがいて、そいつらに攻撃されている」
と自分は規約違反ではないアンチの攻撃だという主張を繰り返した末にBANに至ったという経緯が見えて来た。
「見えて来た」というのは、BANされた本人の投稿はすべて消えているので、他のユーザーのBANへの言及から当時起きたことを推測することしかできなかったから。
だから、欠席裁判とも言えるし、本当に本人の言う通り、集団アンチからの攻撃で理不尽にBANされたという可能性も無いではない。
ただ、運営は規約を杓子定規に当てはめるきらいはあるが(ユーザーが多いので仕方が無い)、全く規約違反ではないユーザーを不当にBANした例というのは聞いたことが無かったのと、
知り合ってから短い期間のメッセージのやり取りだけでも「この人、自分が特別に不当な扱いをされているという被害者意識が強いなあ……」という感触はあったので、
意図的ではないにせよ規約違反をして被害者意識が暴走して止められずにBANされた感じなんだろうなと判断することにした。
「あなたは理不尽にBANされたと言うけど、本当はこういう経緯ですよね?」と上に書いたような判断の根拠を本人に突き付けて質したら、
むしろこちらが「アンチ」の枠に入れられてこの趣味の界隈にいる限り攻撃してきそうなので、どうやって距離を取って関係をフェードアウトしようか思案している。
「嫌いな集団の一員になりすましてヤバい奴として振る舞うことで、その集団の評判を落とそうとする行為」ってなんか特別に名前あったりするの?
例えばAという政党が嫌いな人間がいたとして、そいつがAという政党の支持者になりすましてヤバい発言をしまくることで、その政党や支持者全体のイメージを悪くさせようと画策するみたいな。そういう手法にわかりやすい名前ってあるんだろうかと、ふと気になった。
敵陣営の悪いところを見つけて批判するんじゃなくて、敵になりすましてあからさまな差別発言したり暴言吐いたりして、「やっぱりあいつらヤバい連中だろ?」っていう空気に持っていくやり方って、増田みたいな匿名投稿サイトとかはてブみたいな場所とは特に相性が良いのかもしれん。もちろん実践するのはアカンけど。
前々から増田やブクマカに対して誹謗中傷および暴言を吐いて気炎を揚げている増田がいることが気になっていた。
直近だとこの人は自分がわりと人間のクズであることを自覚した方がよいとかね。
トラバやブコメによると、どうも「国語力増田」と呼ばれている人物らしい。
前は特定の団体や人物に対しての怨嗟を撒き散らしブコメしたブクマカに対して追記で物申すスタイルだったのが、どうも最近になって対象が増田になっている傾向があるように思うえてきた。
その芸風はそのままにバズったり目についた増田に便乗している形だ。
何でなんだろうなーと分析して気づいたが、どうも開示リスクがあることに気づいたっぽい?
国語力増田のスタイルは相手に対して罵詈雑言を喚き散らし中傷する長文を書き殴ることにある。
実在の人物や団体はエゴサする可能性あるだろうしブクマカもある素性を出していれば同定可能性が認められ開示が通る可能性は高い。
また訴訟や開示だといった話でなくとも、はてな匿名ダイアリーでは「言及された当事者から削除の申し立てがあった場合、発信者への意見照会を経ずに削除を行う」といった規則があり、文中でidが言及されりブコメが引用された場合は、当事者が削除申請したら記事が消去される仕組みになっている。
翻って増田を対象にすれば互いに匿名の為そういった心配はハナからしなくていい。5chのレスバで名無し同士が死ねだの殺すだの言っても殺害予告や名誉棄損にならないのと同じだ。
そこで、うーんと考えて閃いた。
「だったら自分の投稿内容と個人情報を紐づければいいのでは?」
まず投稿内容を非公開/公開に切り替えられる投稿サイトを選び実名でアカウント登録する。また個人情報の塊であるFacebook等もリンクしておく。
そして先ず非公開で投稿しておき、同じ内容を増田でも投稿する。これを1セットにすることを習慣付けておき繰り返していく。
そうやって垂らした釣り竿にダボハゼの如く噛みついてきたら反撃開始だ。
非公開にしていた投稿を公開設定に切り替え、その投稿に対して為された言及だとして開示請求をかけ名誉棄損なり名誉勘定侵害で損害賠償請求すれば良い。
上記の増田から例を引けば文中のアウトワードを上から拾っていくだけでも
・脳まで腐りそう
・知能が低すぎ
・おまんこパワー
・バカ
と錚々たる単語が並んでいる。ただの単語でこれなのだから文脈でアウト判定を食らう箇所もあるだろう。実際、増田が比較として挙げた暇空はそうやって開示を通し訴訟しているわけだからな。
こっちは国語力増田が食いついてこなければずっと非公開にしたままでいいのに対し、向こうは検索で見つけることさえできない。
また非公開にしてたのを公開に切り替えて罠にハメたんだと言い張ったところで、それを証明する術はない。
表示される投稿日時は他サイトの方が先かほぼ同時だし、数多あるアカウント群の中から特定のアカウントに目星をつけて切り替えのタイミングを見張ることなんて原理的に不可能だからだ。
昔まとめサイトに無断でまとめられることを嫌ったネット民がアフィ剥がしのDMCA砲を打つため投稿する画像をnoteでも公開しておくという手段を用いてたことから思いついた。
企業側は「いちいち著作権料払ってたら会社潰れる」の精神。GoogleやMicrosoftですらこの態度。国となると、なんの法整備もせずに「全面禁止」を施行するのみ。裏で法整備進めてんじゃないの?と思うかもしれないが、んなことする国はない。
そんなことをしている間に、すっかりAIの生成物がインターネットに溢れることとなった。真のゴミみたいな生成物は闇に埋もれたが、上澄みはというと、人間の手で作ったものと遜色がない。そんな上澄みがどんどん生み出されている(動画はまだ難しそうだが)。この時点で、反AIは詰んでいるのである。
著作権フリーのAIによる生成物。その上澄み。これが次の学習ターゲットだ。著作権者はひとりもいない。投稿サイト側がデータを削除すれば、元も辿れなくなる。