mimi

Sansanの
人・組織・カルチャーを
伝えるメディア

'); for (let i = 0; i < groups.length; i++) { parent.append('

' + groups[i].name + '

'); let list = groups[i].list; let ul = $(''); for (let k = 0; k < list.length; k++) { eles.each(function () { let name = $(this).find('a').text().trim(); name = name.substring(0, name.indexOf(' (')); if (name == list[k]) { ul.append($(this).clone()); } }); } parent.append(ul); } $('#box2 .hatena-module-category ul').remove(); $('#box2 .hatena-module-category').append(parent); $('#navbar-category').append(parent.clone()); };

シカゴで開催された国際学会「IC2S2」に参加しました

こんにちは!DSOC R&Dグループの西田貴紀です。

パリで開催された国際学会「NetSci 2018」に続き、今回は7月12日〜7月15日にシカゴで開催された「IC2S2(2018: 4th Annual International Conference on Computational Social Science)」に参加してきましたので、その様子を紹介します!

Computational Social Scienceとは?

今回の学会の名称にある、「Computational Social Science」という言葉をご存知でしょうか?

おそらく多くの人が聞いたことない言葉だと思います。

「Social Science」というのは「社会科学」という意味で、人間の行動の本質を明らかにすることを目的とした学問分野を指す言葉です。具体的には、社会学、経済学、法学、教育学など、いわゆる文系として知られている学問が該当します。

「Computational」という言葉は「コンピューターによる」や「計算の」という意味で、Computational Social Scienceは日本語で「計算社会科学」と訳されています。

この言葉自体、2009年にLazerらが提唱した言葉であり、これまでの「社会科学」とは異なる、新しい学問分野の名前です。

今に始まったことではないですが、現在はあらゆるものがデジタル化・IT化されてきたことで、人の行動履歴がビッグデータとして蓄積される時代です。例えば、携帯電話などを通じて位置情報が取得されることで人の移動状況が分かったり、TwitterなどのSNSのデータを見ることで人と人のつながりや集団行動などが分かったりするなど、これまで部分的にしか分からなかったものを網羅的に把握することができるようになりました。

この技術進歩によって、簡単かつ網羅的に人の行動に関する詳細なデータを手に入れることができるようになったので、これまでの社会科学の研究では扱えなかったテーマに取り組むことができたり、実証できなかった理論を検証できたりするなど、今まで解明できなかった現象を明らかにするチャンスが訪れたのです。

従って、Computational Social Scienceとは、そういったビッグデータを用いて人間の行動メカニズムの解明を目的とした新しい学問領域のことを指します。この学問に挑戦する研究者のバックグラウンドは、社会科学だけではなく、コンピューターサイエンスや物理学といったいわゆる理系の分野も多く、文理融合の学際的な研究が行われています。

今回は、そんなComputational Social Scienceの分野で最も大きな国際学会であるIC2S2に参加し、先月に投稿したNetSci 2018の参加レポートで紹介した転職の研究についてポスター報告をしてきました。

本レポートでは、IC2S2で聞いた基調講演の中から印象的だったものを紹介します!

Twitterの情報伝播を予測する

今回の基調講演は、合計12人の有名な研究者によって行われました。こちらのウェブサイトで、当日の映像を見ることができます。

その中でも最も興味深かった、マイクロソフトの研究者であるDuncan Watts氏が「Contagion on Social Networks」というテーマで話された講演の内容を紹介したいと思います。

Duncan Watts氏は、Stanley Milgram氏が提唱した「6次の隔たり」という仮説を数理的に研究したことで有名です。「6次の隔たり」とは「世界中の誰かは、知り合いの知り合いという関係を6ステップ経由すればつながることができる」というStanley Milgram氏が実験で発見した結果のことをいいます。

今回、Duncan Watts氏はTwitterのデータを使用し、社会ネットワークにおいて人づてに情報が急激に伝播していくという「カスケード現象」を分析した結果を中心に報告し、Computational Social Scienceの本質に迫るプレゼンテーションを行いました。

「カスケード現象」とは、例えばある商品の普及を考えたとき、初めは緩やかにその商品を購入する人が増えていきますが、ある閾値を超えた瞬間に急激に商品が社会に普及していくといった現象のことを指します。今回のDuncan Watts氏の発表テーマにもある「Contagion」とは「伝染・感染」という意味で、人が周囲の影響を受けて行動を起こしていくさまを病気の伝染・感染となぞらえており、そのContagionのメカニズムの一つとしてカスケード現象があります。

Duncan Watts氏はTwitterのデータを用いて、あるツイートが大量にリツイートがされて情報が伝播していくような現象をカスケード現象として、その現象の大きさを予測しました。予測に当たり、ユーザーのフォロー/フォロワー数、ツイート内容など、利用できる限りの特徴量を用いた予測モデルを作成しました。その結果、先行研究でのパフォーマンスよりも良い結果を残すことができましたが、カスケード現象の大きさの変動の半分以下しか説明できませんでした。また、過去にどれだけリツイートされたかという一つの変数を用いた単純なモデルの性能と全ての特徴量を加えた複雑なモデルの性能に大きな差がないことも示しました。

さらに、Twitterのデータを再現するようなネットワークを生成し、「そのネットワーク上で情報が伝播される様子を理論的に予測できるのか」ということをシミュレーションしていますが、そのシミュレーション結果からも、十分な予測はできず、予測には限界があることが示されていました。

これらの結果から、Duncan Watts氏はカスケード現象のような複雑な社会現象を予測するには限界があることを示唆しました。Twitterの利用可能なデータは、データの量と正確性において、他のドメインのデータと比較しても質が高いデータといえます。もちろん、これから利用できるようなデータが出てくる可能性や、より良いモデルを作成できる可能性も否定できませんが、Twitterのような質の高いデータにおいても十分な予測ができないということから、他の社会現象についても同様に予測には限界があるのではないかという結論を導いています。「予測ができない」という理由は、何かしらのメカニズムで説明できるような決定論的なものがあるだけでなく、ランダムに決まる要素が多い現象であるからです。

最近は、「ディープラーニング、AIを活用すれば何でも予測できる」と言わんばかりのニュースが散見されますが、こと社会現象においてはその予測にも限界があるということをDuncan Watts氏は主張していました。

Computational Social Scienceが解くべき問いとは?

Duncan Watts氏の話については、実証研究から導いた結論も興味深かったのですが、最後に今後Computational Social Scienceが挑戦すべき問いについて言及され、その内容にハッとさせられました。

彼は、今後Computational Social Scienceが目指すべき方向性として、コンピューターサイエンスの視点から「予測の限界を示し、その限界の性質を明らかにすること」を挙げています。具体的には、各社会現象ごとに限界を求めてみたり、既存の技術の制約を加味し、実務的にはどれくらいが限界なのかを明らかにしたりすることです。

社会科学の立場からは「現象のメカニズムを理論化するだけでなく、どれだけ理論でその現象を説明・予測できるのかを示すこと」を掲げています。昨年の石川善樹さんとの対談でも触れましたが、科学の役割の一つに限界を示すことがあります。例えば、19世紀にカルノーという物理学者は、エンジンの燃焼効率には「限界」があることを証明しました。このカルノーの証明によって、開発中のエンジンが「100点満点中何点か?」ということを定量化することができるようになった結果、開発者たちがどこを目指せばいいかが分かるようになり、エンジンの性能が大幅に改善されてきたという歴史があります。

この話と同様に、人の行動のメカニズムを明らかにすることを目的とした社会科学においても、コンピューターサイエンスの立場から示された限界を基にして、やるべきことが明確になるはずです。例えば、もし限界にまだまだ到達していないパフォーマンスであるならば、そこにはこれまでに解明されていない行動のメカニズムがあるということなので、新しい理論を考える余地が残されているはずです。一方で、限界に達している状態であるならば、そもそも行動のメカニズムは分からない、もしくは既存の理論以上にできることはないことを意味します。限界を示すことで挑戦するべきことが明確になり、さまざまな社会現象から効率的にそのメカニズムを解明していくことができるようになることが期待されます。

以上のことから、Computational Social Scienceの本質は、ただビッグデータを使って社会科学の理論を検証するだけでなく、コンピューターサイエンスが限界を示し、その限界を元にして社会科学の視点からさまざまな角度で理論を考えていくというサイクルを通して、社会現象の謎を解明し、その知見を豊かな社会の実現に活用していくことにあると思いました。

学会に参加する前は「Computational Social Scienceは、ただデータのサイズが大きくなった以外にこれまでの社会科学とどういった違いがあるのだろうか?」という疑問を抱いていた私にとって、その答えが明確になったという点で、Duncan Watts氏の基調講演はとても有意義なものでした。互いの強みを生かし、コンピューターサイエンスと社会科学が融合して、効率的に社会課題を解決していくことにワクワクし、私もこの流れに乗って豊かな社会の実現に貢献していきたいと思いました。

アメリカのスケールの大きさに圧倒!

Duncan Watts氏の基調講演は志が高く、スケールの大きいワクワクする話でしたが、学会の開催地であるノースウエスタン大学もまたスケールの大きい素晴らしい大学でした! その壮大なキャンパスの一部を紹介したいと思います!

まず、晴れた日はホテルから学会の会場まで徒歩で移動していたのですが、キャンパスは自然にあふれていてとても心地良かったです。緑があるだけでなく、そこにはかわいいうさぎもいて、とても癒されました。毎朝、最高の散歩をしながら会場に向かいました。

キャンパス内の植物も大学のカラーである紫に統一されていて、こだわりを感じました。

学会の会場であるGlobal Hubという場所に着くと豪華な朝食が用意されています! フルーツが豊富に用意されており、毎日健康的な朝食を取ることができました。五大湖のひとつであるミシガン湖がキャンパスに隣接しているので、食堂から美しい景色を眺めながら優雅な朝食タイムを過ごしました。

午前中に基調講演や研究発表を聞いて、ランチタイムなどの休憩時間にはキャンパスを散歩してリフレッシュしていました。ミシガン湖のほとりには、恋人たちが誓いをペイントする風習があるようです。また、ガールズたちが水着を着て水遊びをしていたりしたので、ここは本当に大学なのかと思いました(笑)!

学会が終わり、夜はアメリカらしさを感じられる料理を食べに行きました。アメリカといえば肉! ということで、ホテルの人からお薦めしてもらった、おいしい肉料理のお店でポークチョップを食べたり、分厚い生地が特徴のシカゴピザを食べたりしました。朝は健康的な食事を取っていたので、罪悪感なく楽しめました(笑)!

ミシガン湖のほとりなど、散歩に適した場所があるだけでなく、キャンパス内に自由に運動できるジムもあり、研究に疲れたらリフレッシュできる環境が整っていて、間違いなく研究がはかどるだろうと感じ、「それは素晴らしい研究がたくさん生まれるな」と妙に納得してしまいました(笑)。

おわりに

今回、SansanはIC2S2のブロンズスポンサーとして学会運営を支援し、参加者の方にはノベルティーグッズを配布させていただきました。

ノベルティーグッズとしては、日本らしさをアピールしたいこととちょうど開催時期が夏だったということもあり、DSOCのプロジェクト「Sansan Data Discovery」のうちわをこの学会のために用意しました!

ランチタイムを外で過ごす参加者の方も多く、30度近い気温だったこともあってか、うちわを使ってくれている方がいて、うれしかったです! さらに、ポスター報告の際に、自己紹介した時には「あのうちわの会社だね!」と声を掛けていただくこともあり、Sansan Data Discoveryというプロジェクトを世界中の優秀な研究者に広めることができました!

パリでの学会に引き続き、私たち自身の研究について、たくさんの有益なアドバイスをいただきました。正直、学会前は今の研究がつまずきかけているのかなとモヤモヤしていたところもありましたが、今回その悩みを解決する意見をいただくことができて、今は希望しか見えていません! 引き続き、Computational Social Scienceのあるべき形を模索しながら、研究成果を私たちのサービスに組み込み、世界を変えるような出会いを演出できるように、日々研究に精進していきます!

執筆者プロフィール

text: DSOC R&Dグループ 西田貴紀