Ekasiliconのゴミ捨て場

ゴミがあります。そこに。

doiって何どい?

論文とかを読んでいると、「doi:」から始まるよく分からない英数字の羅列であったりとか、「https://doi.org」から始まるURLがさもありがたい神様のように扱われていたりする場面に遭遇することがあります。これは果たしてどんな意味を持っているのでしょうか。

ここでは可能な限り専門用語を用いずに、このよく分からない「doi」が何かを説明してみようかと思います。正確性はある程度落ちていますが、大まかにどのようなものかを理解する手助けになれば幸いです。

まとめ

  • リンク切れを防ぐための文字列
  • 世界に一つしかない
  • 短縮リンクみたいなノリで使っても嬉しい

ウェブではどうやって情報が手に入るのか?

この「doi」について理解する前に、ウェブ(WWW)*1上ではどのような形で情報を得られるのかを考えてみましょう。普段はあまり意識しませんが、基本的にウェブにおいては私たちが「ファイルを寄越せ!」と言わない限り何も起こりません。このファイルというのは理屈の上では何でもよく、Wordファイルでも画像でもメモ帳で適当に作ったテキストでも構いません*2。

この「ファイルを寄越せ!」というのを詳しく見ていきましょう。私たちが図書館に行って漢字の読み方を知りたい時には、まず広辞苑を開いてその中にある特定のページを開きます。これを細かく分解すると、

  1. 「広辞苑」という名前の本にたどり着く
  2. 「広辞苑」の中にある特定のページを開く
  3. そして私たちがそのページの中から情報を読み取る

という感じになります。ウェブでも似たようなことが行われており、例えば私のサイトのリンク集である「https://www.eka.earth/links」というところにたどり着くためには、

  1. 「www.eka.earth」という場所にたどり着く*3
  2. 「www.eka.earth」の「links」と名付けられたファイルを開く*4
  3. そして情報を読み取る

といったようなことが行われています。ここにおいて重要なことは、ファイルの中身ではなくその場所に基づいてファイルを寄越してもらっているということです*5。広辞苑で漢字の読み方を調べるのとやっていることは大差が無く、便利でかつ自然な仕組みだなあと思われたかと思います。一方この方式はちょっと不便なところが存在してしまいます。広辞苑は一旦出版されてしまえば(その版である限り)同じ情報が同じページに掲載されていることが明らかです。しかしながらウェブではちょっと事情が異なります。ウェブではその情報を書き換えたりその場所を移し替えることが簡単に出来てしまいますので、「○○の情報はここにありました!」という昔の人の情報に従ってファイルを探したとしても、今は別の場所に存在してしまったり削除されてしまっていたりしていて情報が結局得られないということが起きてしまうのです。

ファイルの中身そのものを用いて情報を共有するシステムも無いことはありませんが*6、多くの人々にとっては今の仕組みが便利かつ自然なものです。しかしながらこのような問題があるので、特に学術論文などの根拠のベースが別の場所にあるものですと、知らない間にそのベースが消えてしまうことになりますから使いづらいものとなってしまいます。これを少しでも軽減するために生まれたのが本題である「doi」です。

世界に一つだけのリンク

doiはまず管理対象とするもの*7に対して、世界で唯一の番号を振ります。これは絶対に被らないようになっており、管理対象とするものときちんと関係づけが行われます。次に管理対象とするものがある場所(例えば https://www.eka.earth/links )をその番号と紐づけておきます。こうすることで世界で唯一の番号が分かれば、それが存在する場所の情報がきちんと得られるようになるということです。

重要なのはこの存在する場所の情報は変更可能であるということです。もちろん変更した後の情報に試しにアクセスしてみたらファイルが存在しないような形で意図的に編集することは出来ません。これを可能にすることによって、例えば「広辞苑」の名前が急に「にっぽん漢字マスター」になったとしても、急にいろは順に並び替えが行われたとしても、これに対応するようにdoi側の、世界で唯一の番号に紐づいている情報を書き換えることで、世界で唯一の番号が分かれば、それが存在する場所の情報がきちんと得られるという状態を維持することが出来ます。

また論文などの場所の情報に著者の名前やタイトルなどをそのまま使ってしまうとどうしても長くなってしまいますし、似たような情報の論文があったとして、これを取り違えてしまうことも考えられます。しかしながらこの世界で唯一の番号を使うことによって、取り違えを防ぐことが出来る他、Twitterなどにおいて論文を共有する時などに「この論文です!」ということを短くかつ明確に示すことが出来ます。そのため、論文(に限りませんが)への短縮リンクみたいに使うことも出来ます。

結びに

以上、doiとはどのようなものかについて可能な限り簡単にして説明してみました。本文中に脚注(右上によった数字みたいなやつ)が付きまくっていることに気づいた読者の方もいらっしゃるかと思いますが、そちらにはもうちょっと踏み込んだ説明やワードのヒントを書いてあります。ちょっと面白いかも!と思われた方は調べてみてみると楽しいかもしれません。

それでは。

*1:細かい話ですが、「インターネット」と「ウェブ(WWW)」は異なる概念です。ウェブはインターネットに含まれる概念(インターネットの方が大きい概念)であり、インターネットそのものは世界中のコンピュータを結ぶネットワークそのもの及びそこで使える諸々のことを指します。

*2:通常はHTMLと呼ばれる、ウェブにおいて便利に使えるよう特別に書き方が設計されたファイルが用いられています。HTMLはパソコンでカタカタして作るファイル(メモ帳でも作れる)なのですが、別のところに置いた画像や動画などを呼び出して表示させるといったことが可能です。

*3:ここにおいてはDNSと呼ばれる仕組みが用いられております。欧米の住所のように逆から、すなわち"earth"→"eka"→"www"のような形で、それぞれの名前がどこにあるのかを問い合わせてくれます。

*4:正確に言えば「links」と名付けられたフォルダの中にあるindex.htmlが開かれます。

*5:ちなみにURLの「L」はLocationの「L」です

*6:IPFSが代表的です。

*7:本や雑誌の記事の記事、画像一枚それぞれにも振ることが出来ます。