R言語のことを「統計のリンガフランカ」と表現する例

概要
R言語のことを「統計のリンガフランカ」と表現することがある。統計やデータサイエンスに関わる人にとって、R言語が共通言語であることを示している。最初にこう呼んだのは、UCLAの統計学部の教授の Jan de Leeuw 氏であると思われる。

R言語はリンガフランカ

統計解析でよく使われるR言語のことを「統計のリンガフランカ」あるいは「データサイエンスのリンガフランカ」と呼ぶことがある。「リンガフランカ」(lingua franca) とは共通言語のこと。統計解析に関わる人が統計解析について議論するときの共通言語として、Rが使われているということだ。

例えば、2010年のとあるブログ記事では、以下のようにRがリンガフランカと表現されている。

R is the lingua franca of Statistics: R code and R packages is the means by which statisticians communicate ideas and methods for statistical analysis. (訳:Rは統計のリンガフランカである。すなわち、RのコードとRのパッケージは、統計家がアイディアや統計解析の手法を交わす手段である。)

Smith (2010)

新しい統計手法を発表する際に、その手法をRのコードで書いたり、Rのパッケージを公開したりすることはしばしばある。また、統計に関する教科書で、分析内容をRのコードで示す例もしばしばある。他のプログラミング言語や統計ソフトを使っても良いのであるが、多くの統計家がRを理解しているので、Rで示した方が話が通じやすいのだ。その意味で、Rはリンガフランカ、すなわち共通言語なのだ。

R言語は、統計に関わる人にとっての共通言語となっている。
R言語は、統計に関わる人にとっての共通言語(=リンガフランカ)となっている。

R言語をリンガフランカと表現した初めての例

私が調べたかぎりでは、R言語のことを最初にリンガフランカと表現したのは、UCLAの統計学部の教授の Jan de Leeuw 氏のようだ。R の fortunes パッケージは、2003年8月の Joint Statistical Meetings という学会での de Leeuw 氏のコメントとして以下のものを載せている。

R is the lingua franca of statistical research. Work in all other languages should be discouraged.(訳:Rは統計的研究のリンガフランカである。他の言語での作業は推奨されるべきではない。)

R fortunes: Collected wisdom (2016)

残念なことに、私が探したかぎりでは、上記の引用の直接の出典は見つからなかった。ただ、de Leeuw 氏は、2005年1月に出した論文の中で、以下のように書いている。

It is obvious now, and it was obvious then, that S was rapidly becoming the lingua franca of statistics. (訳:Sが急速に統計のリンガフランカになりつつあることは、今でも明らかであるし、当時も明らかであった。)

de Leeuw (2005)

ここでは、統計のリンガフランカとしてS言語が挙げられている。SはRの前身だ。上で引いたのは、1998年にUCLAの統計学部が統計ソフトとして XLISP-STAT を使うのをやめてSを使うようになったことを説明した論文だ。つまり、上記の引用で「当時」とあるのは、1998年当時にSが統計のリンガフランカになりつつあることが明らかだったという意味である。そして、「今でも明らかである」というのは、この論文が出された2005年の時点の話である。この時点では、Sではなく、後進のRが広く使われるようになっていた。だから、上記の引用は2005年の時点で R がリンガフランカであると事実上認めていたことになる。

さらに、2005年11月付けの R News には以下の記述がある。なお、上記の de Leeuw 氏の文章と同様に、英文では、lingua franca (リンガフランカ)の前に定冠詞の the がついている。たくさんあるリンガフランカの1つではなく、唯一の共通言語だというニュアンスがあるのだろう。

R as the ‘lingua franca’ of data analysis and statistical computing(訳:データ分析と統計解析の「リンガフランカ」としてのR)

Forthcoming events: useR! 2006. (2005)

また、同じ2005年の12月には、以下の記述がなされている [1]

R has become the lingua franca of statistical computing. (Rは、統計解析のリンガフランカとなった。)

Hothorn & Everitt (2006)

いずれにせよ、2003年の de Leeuw 氏の言葉が実際には存在しなかったとしても、2005年には確実にR言語をリンガフランカと呼んでいたことが分かる。

その後の事例

その後も R はリンガフランカと表現されつづけている。例えば、2009年のニューヨークタイムズの記事では、以下の記述がある。

R is also the name of a popular programming language used by a growing number of data analysts inside corporations and academia. It is becoming their lingua franca […](訳:Rもまた好評を博しているプログラミング言語であり、企業や学界でこれを使用するデータ分析者が増えつづけている。Rはデータ分析者のリンガフランカとなりつつある。)

Vance (2009)

また、2016年には、“R as a lingua franca”(リンガフランカとしてのR)というタイトルの論文が出されている。これは、応用言語学分野でRを使うことを勧める論文である (Mizumoto & Plonsky, 2016) 。

このほか、2018年に書かれたR言語の紹介では、Rが “lingua franca of the statistics and data science communities”(統計とデータサイエンスのコミュニティーのリンガフランカ)であると表現されている (Thieme, 2018)。

参考文献

脚注
  1. ここに引いた記述は、2006年に出版された書籍の序文に書いてあるものだ。書籍の出版は2006年であるが、序文自体は2005年12月に書かれた。 []