R言語はリンガフランカ
統計解析でよく使われるR言語のことを「統計のリンガフランカ」あるいは「データサイエンスのリンガフランカ」と呼ぶことがある。「リンガフランカ」(lingua franca) とは共通言語のこと。統計解析に関わる人が統計解析について議論するときの共通言語として、Rが使われているということだ。
例えば、2010年のとあるブログ記事では、以下のようにRがリンガフランカと表現されている。
新しい統計手法を発表する際に、その手法をRのコードで書いたり、Rのパッケージを公開したりすることはしばしばある。また、統計に関する教科書で、分析内容をRのコードで示す例もしばしばある。他のプログラミング言語や統計ソフトを使っても良いのであるが、多くの統計家がRを理解しているので、Rで示した方が話が通じやすいのだ。その意味で、Rはリンガフランカ、すなわち共通言語なのだ。
R言語をリンガフランカと表現した初めての例
私が調べたかぎりでは、R言語のことを最初にリンガフランカと表現したのは、UCLAの統計学部の教授の Jan de Leeuw 氏のようだ。R の fortunes パッケージは、2003年8月の Joint Statistical Meetings という学会での de Leeuw 氏のコメントとして以下のものを載せている。
残念なことに、私が探したかぎりでは、上記の引用の直接の出典は見つからなかった。ただ、de Leeuw 氏は、2005年1月に出した論文の中で、以下のように書いている。
ここでは、統計のリンガフランカとしてS言語が挙げられている。SはRの前身だ。上で引いたのは、1998年にUCLAの統計学部が統計ソフトとして XLISP-STAT を使うのをやめてSを使うようになったことを説明した論文だ。つまり、上記の引用で「当時」とあるのは、1998年当時にSが統計のリンガフランカになりつつあることが明らかだったという意味である。そして、「今でも明らかである」というのは、この論文が出された2005年の時点の話である。この時点では、Sではなく、後進のRが広く使われるようになっていた。だから、上記の引用は2005年の時点で R がリンガフランカであると事実上認めていたことになる。
さらに、2005年11月付けの R News には以下の記述がある。なお、上記の de Leeuw 氏の文章と同様に、英文では、lingua franca (リンガフランカ)の前に定冠詞の the がついている。たくさんあるリンガフランカの1つではなく、唯一の共通言語だというニュアンスがあるのだろう。
また、同じ2005年の12月には、以下の記述がなされている [1] 。
いずれにせよ、2003年の de Leeuw 氏の言葉が実際には存在しなかったとしても、2005年には確実にR言語をリンガフランカと呼んでいたことが分かる。
その後の事例
その後も R はリンガフランカと表現されつづけている。例えば、2009年のニューヨークタイムズの記事では、以下の記述がある。
また、2016年には、“R as a lingua franca”(リンガフランカとしてのR)というタイトルの論文が出されている。これは、応用言語学分野でRを使うことを勧める論文である (Mizumoto & Plonsky, 2016) 。
このほか、2018年に書かれたR言語の紹介では、Rが “lingua franca of the statistics and data science communities”(統計とデータサイエンスのコミュニティーのリンガフランカ)であると表現されている (Thieme, 2018)。
参考文献
- de Leeuw, J. (2005). On abandoning XLISP-STAT. Journal of Statistical Software, 13(7), 1–5. https://doi.org/10.18637/jss.v013.i07
- Forthcoming events: useR! 2006. (2005). R News, 5(2), 43. https://journal.r-project.org/news/RN-2005-2-forthcoming-events-user-2006/RN-2005-2-forthcoming-events-user-2006.pdf
- Hothorn, T. & Everitt, B. S. (2006). A Handbook of Statistical Analyses Using R. Chapman and Hall/CRC.
- Mizumoto, A. & Plonsky, L. (2016). R as a lingua franca: Advantages of using R for quantitative research in applied linguistics. Applied Linguistics, 37(2), 284–291. https://doi.org/10.1093/applin/amv025
- R fortunes: Collected wisdom. (2016). https://cran.r-project.org/web/packages/fortunes/vignettes/fortunes.pdf
- Smith, D. (2010, October 25). The language of statistics. Revolutions. https://blog.revolutionanalytics.com/2010/10/the-language-of-statistics.html
- Thieme, N. (2018). R generation. Significance, 15(4), 14–19. https://doi.org/10.1111/j.1740-9713.2018.01169.x
- Vance, A. (2009, January 6). Data Analysts Captivated by R’s Power. The New York Times. https://www.nytimes.com/2009/01/07/technology/business-computing/07program.html
- ここに引いた記述は、2006年に出版された書籍の序文に書いてあるものだ。書籍の出版は2006年であるが、序文自体は2005年12月に書かれた。 [↩]