まず、最初は「分類あるいはメタデータ」について。
メタデータの歴史
ピーター・モービルは『アンビエント・ファインダビリティ』の中で、メタデータの歴史について、次のように記述しています。カード目録の利用の歴史は、紀元前650年のアッシリア帝国の首都ニネベにまでさかのぼる。当時、アッシュールバニパル王が、大まかな主題別目録と記述的書誌を備えた3万点を超える粘土板を所蔵する、王宮図書館を設立したのである。もちろん、広義の解釈では、メタデータは言語そのものと同じぐらい古い歴史を持つことになる。人や場所や所有物に名前を与える時、人間はそれらの対象物にメタデータによるタグ付けをしているというわけだ。ピーター・モービル『アンビエント・ファインダビリティ』
ここでモービルは広義の解釈として名前そのものをメタデータとして扱い、対象物を名前つける行為そのものがタグ付けであることを示しています。
そして、それが紀元前650年にもなると、名前付けの対象として目録や書誌などの粘土板というインフォメーション・アーキテクチャそのものがカード目録というメタデータによる管理対象となり、その3万点もの粘土板とカード目録による王宮図書館というメタ・インフォメーション・アーキテクチャの成立につながることを示しています。
僕たちにはもはや当然としか感じられない名前とその対象の一致という名前付けが歴史的なものであり、かつ、それは言語誕生の歴史とイコールではないことが次のような例をみるとわかります。
スティーヴン・ミズンが『歌うネアンデルタール―音楽と言語から見るヒトの進化』で提起した前言語的コミュニケーション形式Hmmmmmにおいてヒトは、言語を名詞や動詞に分節された言語ではなく、ある特定の音の連なりが全体的にある操作的な意味を有する言語によってコミュニケーションされていたと想像されています。
ホモ・エルガステルの原型言語は、全体的な発話からなっていた可能性が高い。アリソン・レイが提唱したように、それぞれの発話には固有の意味があるが、意味をなす下位単位(つまり、単語)はない。レイは架空の例を挙げてこのような発話を説明している。たとえば、「テビマ」という連続音節が「彼女にそれをわたせ」という意味で、「ムタピ」が「私にそれをよこせ」という意味だったとする。どちらの場合も、そして、ほかに想像できそうなどんな全体的発話も、個々の音節を発話の意味に登場する実体や行動に割り当てることはできない。これにもっとも近い今日の発話は「アブラカダブラ」の類だ。スティーヴン・ミズン『歌うネアンデルタール―音楽と言語から見るヒトの進化』
このような段階での言語は、対象に対して指示的ではなく、単に発話の相手に対して操作的であるにすぎません。したがって、この段階の言語=Hmmmmmはメタデータ的ではなかったことになります。
言語は必ずしも何かを指示するものではないことは、後にソシュールらの言語学において、シニフィエ(記号内容)なきシニフィアン(記号表現)が問題にされたのとは類似しているようにも思えますが、後者はあらかじめシニフィアンはその指示対象としてシニフィエをもつことを前提としている限りにおいて、Hmmmmmの全体的で操作的な発話とは異なるものです。
(参考:シニフィアンとシニフィエ- Wikipedia)
メタデータは言語に必須のものではなく、単に歴史的に選択されたものであることがこのような研究からわかります。
言語を単語単位に分節化し、言語をメタデータ的に利用できるようになった時、それは同時に、ヒトに象徴的な記号を用いた、構成的な思考を可能にし、それまで20万年以上停滞していたヒトの文化を一気に進歩させました。洞窟に動物の絵を描いたり、赤を血の色を象徴するものとして利用したり、それらの行為は象徴的、構成的な思考が可能になってはじめて花開いたのだそうです。
メタデータと分類
「分ける」ことは「分かる」ことです。何かを分類し、そこに分類的なメタデータを付与することは、対象物に対する理解の形式を定義することです。
何をどう分類したかは、何をどう理解したかによります。
生物を進化の歴史における系統樹で分類するのか、生息地や生活様式、体のデザインなどによって分類するのかではまったく意味するところは異なります。本屋や図書館で本を分類する場合でも、その内容によって「ビジネス書」や「小説」、「経済学」「物理学」「コンピュータ」などと分けることも可能ですし、使い勝手ははるかに落ちますが、作者別や出版社別の分類も可能です。
何をどう分類するか、すなわちある対象にどのようなメタデータを付与するかは、その対象をどのように理解し、また、どのように理解してもらいたいかに拠るのです。物事の理解に1つの答えがないのと同様に、必ず正しいといえる分類はないのです。
分類とメタデータは対象群をいかに理解し、どう秩序付けたかを示すものであり、それはツリー構造のタクソノミーであろうと、オントロジーのような対象の属性によって関係性を示すようなものでも同じだと思います。
「2つの階層構造、2つの分類法(タクソノミーとオントロジー、あるいは、クラスとセット)」では、数学的なクラスとセットの違いから、タクソノミーの階層構造的な分類法とオントロジーの平屋建て的な分類法との違いを見ましたが、どちらもそれが指示的な分類であり、対象に対してメタデータを付与するという意味では同じです。
それは現在のホモ・サピエンスであるヒトの物事の理解が指示的で構成的であるからで、あくまでヒトと情報の関係において理解する必要があることをあらためて考えさせられます。
メタデータとデータの分離
そして、このことを理解することで、先にあげた「シニフィエなきシニフィアンが問題」になるのと同じ次元で、メタデータとデータそのものを切り離すことが意図的に可能になります。インターフェースはインフラという土台の上に成り立つもなので、未来のユーザーエクスペリエンスは、現在のセマンティックウェブ技術の基盤をよりどころとするだろう。記述的かつ構造的な管理上のメタデータを、内容や表現や動的な要素から分離できるその威力は、IAにとって計り知れない恩恵をもたらす。われわれIAはなおも、検索やナビゲーションのシステムにおいて構造的メタデータの意味論的な価値を最大限に活用しなくてはならない。ピーター・モービル『アンビエント・ファインダビリティ』
メタデータをデータそのものと切り離すことで、表現の自由さは損なわれることなく、管理的な分類、構造的な分類が可能になります。
これはインターネット上のWebというインフォメーション・アーキテクチャの場合、異なるインフォメーション・アーキテクチャ同士の相互解釈、共通理解にとって、重要な意味を持ちます。
いわゆるセマティックウェブが狙っているのはこの部分だといえるでしょう。
それはIA同士がヒトを介さずつながることを想定していなかった本のような場合には問題にならなかった事柄です。その場合、先にあげたカード目録のようなものを無視すれば、本の内部ではデータそのものとメタデータはまったく切り離されていなくても、何の問題もなかったということを意味します。
あるいはカード目録が本と物理的に切り離されたいたこと自体、メタデータとデータの切り離しが行われていたとみて、それにより本と別の本の関係性を記録することができたと理解してもいいでしょう。
しかし、それでも本の中身の一部を切り出して、記述するメタデータを使うのは、Webサイトにおいてモジュール単位でメタデータを付与する(例えば、マイクロフォーマットなどを用いて)ことができるのとは、やはり雲泥の違いがあると言わざるをえないでしょう。
メタデータとデータの切り離しは、それがIA同士の関連付けを意識したとたん、重要な課題になるものだと考えてよいでしょう。
しかし、IA同士の関連づけにおいて重要な問題であるということは、逆にそれはヒトにとっては直接的な恩恵をもたらさないという意味でもあるということは忘れてはいけないことでしょう。
どういうことか?
ちょっと長くなりましたので、この続きはまた次回に考えてみることにします。
- 私的インフォメーション・アーキテクチャ考:0.何を行うのかの定義
- 私的インフォメーション・アーキテクチャ考:1.要素としての情報の種類
- 私的インフォメーション・アーキテクチャ考:2.構造と要素間の関係性:その概要
関連エントリー
- アンビエント・ファインダビリティ ウェブ、検索、そしてコミュニケーションをめぐる旅/ピーター・モービル
- 歌うネアンデルタール―音楽と言語から見るヒトの進化/スティーヴン・ミズン
- 2つの階層構造、2つの分類法(タクソノミーとオントロジー、あるいは、クラスとセット)
この記事へのコメント