yasuokaの日記: Re: 書写言語研究におけるサンプルデータの重要性と妥当性 1
一昨日の日記の読者から、松谷創一郎の『立命館大学の研究者による「pixiv論文」の論点とは──“晒し上げ”批判はどれほど妥当なのか』(Yahoo!ニュース、2017年5月27日)を読んでほしい、との御連絡をいただいた。読んでみたのだが、この記事の問題意識が、私(安岡孝一)にはサッパリ理解できなかった。特に以下の部分。
この一件を俯瞰してみれば、オタクコミュニティ(SNS)と人工知能の研究者(理工系)という、まったく異なるコミュニティ(領域)の衝突と言える。
私には、そうは思えない。少なくとも、近江龍一・西原陽子・山西良典の『ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング』(人工知能学会第31回全国大会論文集, 2M2-OS-34a-1, 2017年5月24日)は、人工知能の研究者というコミュニティを代表している論文ではなく、それを「理工系」の「領域」などと一括りにするのは、あまりに議論が雑すぎる。また、
もちろん今回のケースは、参与観察とは明確に異なり、どちらかと言えば文献調査に近い。よって、参与観察と同じではない。
という点を、松谷創一郎が理解できているなら、
最後に、筆者が友人の研究者5名(すべて社会学系)とやり取りして、さまざまに考えたことを書いておく。
社会学系の研究者に限定してヒアリングする意味が、私には理解できない。松谷創一郎の友人には、計量言語学の研究者が一人もいないのかしら?
書写言語研究は、その本質において、他人の書いた文章等を対象にせざるを得ない。だからこそ、著作権法第三十条の四において、公表された著作物を広く集めて全文利用することが許されているのだ。その「公表された著作物なら何でもOK」といういわば特権があるにも関わらず、あえてサンプルデータをpixivのR-18小説に限定したのなら、その限定の妥当性を近江龍一・西原陽子・山西良典の3人は説明する必要がある。と私個人は考えるのだが、さて、松谷創一郎は違う考えなのだろうか?
「引用」と「技術の開発又は実用化のための試験の用に供するための利用」 (スコア:2)
著作権法第三十条の四と第三十二条の違いについて、私(安岡孝一)の今日の日記 [srad.jp]で補足しました。