« この本がスゴい!2025 | トップページ

学術論文の被引用数は「7回」「40回」を超えるとバズる『サイエンス・オブ・サイエンス』

N/A

過去のデータを分析して、その傾向から何かしらの因果や法則を見出し、再現性を計測する。この営みを科学という。営むターゲットが素粒子や遺伝子や恒星など、適用先によって呼び名は違えども、本質は一緒だ。営まれてきた研究成果や論文は膨大な数となり、かつ、指数関数的に積み上がっている。

では、適用先を「科学」そのものにしてみたら?つまり、「科学の営み」そのものをターゲットとし、論文、プレプリント、助成金申請書、特許を過去データとし、研究活動の痕跡データを解析する。

なにしろ登録された論文だけでも5,800万件にも及ぶ。論文の最初の1ページをプリントアウトして積み上げると、キリマンジャロの頂上(標高5,895m)まで達する。これを「科学の山」という。

うち1,000回以上引用されたのは頂上付近の1.5m で、ほぼ頂点となる上から1.5cmは、1万回以上引用されたものになる(ちなみに、五合目以下の半分は、一度も引用されたことがないそうな)。

この論文の山そのものが、研究対象になる。いつ、どんなテーマで書かれており、論文同士がどのように引用/被引用されているのか、インパクトのある論文は、どの国の、誰が、どの年齢のとき、どんなチームで書かれたのか、ヒット後のキャリアにどう影響があったのか(本人・チームメンバー)を分析していく。

アインシュタインやエルデシュのようなレジェンドも扱うが、それはむしろ外れ値になる。この山はむしろそうしたスター級の科学者だけでなく、その下の膨大な人々の営みによって支えられているのだから。

本書の研究によって、さらにメタ的な視点も得られる。即ち、科学そのものの進化プロセスをどう加速していくのかといった観点や、科学者の生産性および大学・研究機関における知的資源の配分をどう効率化するのかといった視点からも得るものが大きい。

この学問領域が、「サイエンス・オブ・サイエンス」になる。

本書の想定読者は大きく2つ。

まず、科学者としてのキャリア形成が気になる研究者や学生だ。どんなチームや共同研究が成功を生み出すのか? キャリアのピークはいつで、ヒットの前兆は何か? 若手が成功する確率を上げるには? といった疑問にデータで答えようとする。

次は、そうした研究者を採用・助成・管理する、大学や研究機関になる。テニュア審査や人事、助成金の配分の意思決定に際し、被引用数やh-indexをどう扱えばよいか? 研究の生産性を上げる施策として有効なものは何か? こうしたテーマで、科学が科学されている。

論文マタイ効果

「マタイ効果」とは、キリスト教の聖句「持てる者はますます豊かになり、持たざる者はますます貧しくなる」に由来する。有名な研究者に功績が集中したり、一度注目された論文はさらに注目されるというバイアスのことだ。

有名な例だと、「巨人の肩の上に立つ」という言葉だろう。巨人の肩(=先人の積み重ね)のおかげで、より遠くまで見通せるメタファーだ。12世紀の哲学者シャルトルのベルナルドゥスの言葉なのだが、400年後のアイザック・ニュートンの言葉として有名だ。

本書では、レイリー卿の例が挙げられている(空の青さのレイリー散乱の人)。1886年にある論文をイギリス学会に投稿したところ、掲載レベルではないとして即リジェクトされた。ところが、著者名にレイリーの名が漏れていたことが判明し、名前を追加して再投稿したところ、編集部から陳謝の言葉と共に即掲載されたという。

「何を言ったか」より「誰が言ったか」が大事なのは、SNSだけじゃなさそうだ。

では、実績が少ない若手科学者は、いつまでも評価されないのか?どこまで実績を積み上げればよいのか?

2013年にScience誌に掲載されたWangの論文では、被引用数の閾値が考察されている。世界最大級の学術論文データベースWeb of Scienceを元に、物理・生物・化学・医学・工学・社会科学の領域から解析したものになる(※1)。

Wangによると、被引用数が7回を超えると、優先的選択が急激に高まるという。

注意が必要なのは、「7回引用されればマタイ効果が出る」という訳ではないこと。

無名の新人が書いた論文であっても、掲載されたジャーナルの格や、研究分野のトレンド、著者や共著者の評判といった、社会的要因が引用数を押し上げることになる。Wangはこれを初期魅力度と定義している。

そして、最初の段階では、この初期魅力度によって引用数が左右されるものの、被引用数が7回を超えると、初期魅力度に関係なく、優先的に選択されるようになるというのだ。

さらに、キャリアに対する評判とインパクトを研究したPetersenによると、被引用数が40回を超えると、急増することを指摘する(※2)。

被引用数が多い物理学者を調査したところ、平均的な挙動として、被引用数が40を下回るときは、増加率はゆっくりで、著者の評判が引用数に影響する。

ところが、被引用数が40を超えると、増加率が急激に上昇する。検索結果でもレビュー記事でも目につきやすくなり、自力で引用を呼ぶ仕組みが出来上がる。このクロスオーバー点を超えた論文は、マタイ効果の自己強化ループに乗り、伸びるものは加速度的に伸びていくというのだ。

被引用数が7回を超えると、「引用されているから引用する」ループが回り始め、40回を超えると、自律的に強化されていく。「7回」と「40回」というこの数値、はてなブックマーク数や、twitterの「いいね」に似てて面白い。バズる論文は、似たような挙動を示すのかもしれぬ。

科学の自動化

科学を科学する試みの中で、ロボット科学者「アダム」の話が面白かった。

科学の営みって、結局のところ「仮説生成」と「仮説検証」に尽きる。データや理論から仮説を作り上げるステップと、そうして作った仮説を確かめるステップだ。前者はAIの得意技かもしれないが、後者ができるのは人の領域だとされてきた。

ところが、「仮説を考える+その仮説を確かめる」の両方を自動化したのが、アダムになる。

アダムは、酵母の遺伝子機能に関する仮説検証を完全自動化したロボットだ。

Photo_20251207182601


アダムの全体像(”The automation of science”wayne aubrey,2009 [URL]

遺伝子構造は分かっているが、どのような働きをしているのか分かっていない酵素が数多くある。その酵素の働きを特定するためには、酵母や培養条件を考え、人手で何日もかけて検証していく必要があった。これを全自動化したというのだ。

アダムは既知の酵母の遺伝子情報や、培養モデルをインプットし、酵素の反応を導く遺伝子候補やその結果となる表現型を推定する。そして、酵母株や培養モデルや代謝物の条件を変えながら自律的に実験する。

ロボットなので、プレートやアームや温度湿度の制御も自分でコントロールできる。培養物の成長曲線も観察し、仮説が正しければ得られるはずの結果と照合する。人がやったことと言えば、不要となった培養物の廃棄と、実験器具の補充だったという。

アダムはデータの有意差も自分で検定し、最終的には酵素をエンコードする遺伝子に関する12の検証済み仮説をアウトプットした。

科学文献を調査したところ、12の仮説のうち6つは既に発表されていたという。そのため、この6つについては厳密な意味での新発見とは言えないものの、ロボットが独力で見つけた成果としては大きい。

さらに重要なのは、どの文献にも載っていなかったエンコード遺伝子を3つ発見したという点にある。これは、ロボットが科学的意識を自律的に生み出した最初の事例といってもいいだろう。

24時間366日、不眠不休で働き続けるロボット科学者。夢のような話だが、SF脳からすると、「致死的ウィルスとか放射性反応といった、人だとダメージを食らう実験も任せられるんじゃね?」という発想も浮かぶ。

アダムに任せられた酵母は、ビールやパンに用いられる一般的な(=安全な)種になる。ある意味、象徴的なテーマだね。

ちなみに、アダムの次世代機はGenesisと呼ばれており、独立した1,000ユニットを同時に稼働させ、酵母だけでなく、代謝ネットワークや細胞レベルの挙動を解析する科学のオートメーション・システムになる。アダムを一人の大学院生に喩えるなら、Genesisは1,000人の研究員になるという。

科学を科学する。顕微鏡や望遠鏡を始めとし、遺伝子編集のCrispr-cas9や巨大粒子加速器など、様々な機器を用いて、科学は発展してきた。そのレンズを、科学そのものへ向ける営みが「サイエンス・オブ・サイエンス」だ。

日本でも研究会があり、自分でデータも利用できるみたいだ。

第1回 Science of science研究会へ参加してきました|Metascience Bento-kai

科学をメタ的に眺めることで、科学を加速するアイデアも得られるかもしれぬ。そういうヒントに満ちた一冊。

 

※1 “Quantifying Long-Term Scientific Impact” Dashun Wang,et al,2013 [PDF]
※2 "Reputation and Impact in Academic Careers” Alexander M. Petersen,et al, 2014 [PDF]
※3 "The automation of science” wayne aubrey,2009 [URL]
※4 “Genesis: Towards the Automation of Systems Biology Research” Ievgeniia A. Tiukova,2024 [URL]



このエントリーをはてなブックマークに追加

|

« この本がスゴい!2025 | トップページ

コメント

コメントを書く



(ウェブ上には掲載しません)




« この本がスゴい!2025 | トップページ