諸言語の源「祖語」をコンピューターで復元

諸言語の源となる「祖語」を逆行分析し、復元できるプログラムが開発された。入力した言語データから、機能変化の理論や規則を求めるものだ。
諸言語の源「祖語」をコンピューターで復元
ロゼッタストーン。Photo:Nrbelex/Flickr

消滅した「祖語」を逆行分析できるコンピュータープログラムを、カナダと米国カリフォルニア州の研究者チームが作成した。

「Nature」誌に掲載された、研究論文についての概要によると、このプログラムは話し言葉の機能が時間とともにどのように変化したかについての理論や規則を求め、それを現代の言語に適用するものだ。確率論的モデリングを複数のアルゴリズムと組み合わせて使用することにより、「現代の言語から祖語(Proto-language)を自動的に、正確に復元する」という。

祖語とは、世界の諸言語に共通する原型である、すでに消滅した、基礎となる言語のことだ。 (互いに関連のある言語を歴史的に遡っていくとある時点でひとつの言語となるが、その言語のことを祖語という。例えば、インド・ヨーロッパ語族(印欧語族)の祖語は「印欧祖語」、インド・ヨーロッパ語族のゲルマン語派に属する言語の祖語は「ゲルマン祖語」と呼ばれる。)

プログラムに対して行われたテストのなかには、637種のオーストロネシア語族(南島語族。オセアニアと東南アジア一帯に住む人々)の言語データを入力して得られた出力を、この語族を専門とする言語学者が手作業で作成した結果と比較したものも含まれている。研究によると、生成された結果の85%超が、「手作業によって復元されたひとつの特性に含まれていた」という。

論文を書いたひとりであるブリティッシュ・コロンビア大学の統計学者アレクサンドル・ブシャール=コテは、「われわれのプログラムでは、言語学者が検討対象にする要素の一部しか使っていない。相違点のほとんどは、われわれの方法における改良すべき点を示していると考えられる」と述べている。

正確さの問題が解決されるまでは、いままで通りに手間のかかる手作業による復元方法を選択する方が賢明だが、このシステムが備える、大量のデータを処理して「言語の進化理論」をテストする能力は非常に興味深い ものだ。

さらに研究チームはこのプログラムを利用して、構造主義派の言語学者であるアンドレ・マルティネが1955年に提唱した、「機能負担量」についての仮説も調べた(機能負担量とは、ある音韻特徴がもつ弁別機能の高さのこと)。

マルティネの仮説は、「類似する音は、そうすることによって過度に意味の喪失が起きない限り、やがては併合される」という考え方だ。この仮説は、今回のシステムによって明確に支持された。従来の言語学の手法では、確実な結論を導き出すのに苦労してきた(あるいは、矛盾が見つかってきた)ものだ。

TEXT BY PHILIPPA WARR

TRANSLATION BY MAYUMI HIRAI, HIROKO GOHARA/GALILEO