これがどういう意味かを今回は明確にしていきたいと思います。
差異の記号表現としての言語
まず、前回、何気なく使った「分類」という言葉と「メタデータ」という言葉の定義から。定義とは言っても、僕自身がここでどうこの2つの言葉を用いるかという意味においての定義であり、公式な定義ではないかと思います。では、簡単に。
「分類」とは、対象となるデータ群を特定のルールに従い、識別可能な属性をつけること。「メタデータ」とは、その属性の具体的な名称。
はい。これだけ。
わかりやすく言うと、前者がタグ付けで、後者がタグであると想定しています。
なので、ここで僕はどちらかというと、タクソノミーではなく、オントロジーをイメージしているわけです。クラスとサブクラスからなる階層構造的な分類構造をイメージしているのではなく、ある独立したエンティティに対してそれを示す属性を付与するイメージです。
具体的な例をあげれば、従業員に対して、従業員番号、従業員名が付与されるイメージ。その際、入社日や所属部署はこのエンティティの属性ではなく、別のエンティティ(「入社」「所属」)の属性であり、それぞれエンティティ同士の関連付けによって示される。と、そんなイメージを極端なまでに拡張すると、実はデータとメタデータの区分はかなりあいまいになるのではないかと思っています。つまり語の1語1語がメタデータと化し、極端な場合、1語に対して複数の属性が付与されることにもなりえます。
たとえば、こんな例を考えてください。
「カモノハシ(1)」は、「哺乳類(2)」であり、「クチバシ(3)」をもち、「オーストラリア東部(4)」および「タスマニア(4)」に棲み、「ハリモグラ類(5)」と近縁で、現存する哺乳類の中では「ヒト(6)」ともっとも遠縁で、巨大大陸「ゴンドワナ(7)」で進化した初期哺乳類で、ほとんどを「水中(8)」で暮らし、泥の中の「無脊椎動物」を食べている。
(1)は「名称」、(2)は「大分類」、(3)は「体の特徴」、(4)は「生息地域」、(5)は「近縁の類」、(6)「遠縁の類」、(7)は「最初に進化した場所」、(8)は「生息環境」という属性ではあるものの、このすべてがメタデータであると同時にデータでありえます。
言語が差異の記号表現だとしたのはソシュールですが、その差異は相対的な差異であって、絶対的な差異ではありません。あくまで相互の相対的な差異の表現が言語であって、言語そのものが絶対的な意味をもつものではないということです。それゆえ言語は常に外部参照としてのメタデータを最初から非明示的な形で有していると考えてもいいのかもしれません。
明示的な分類と非明示的な分類
しかし、その差異の体系である言語のシステムを、言語以外の形で表現できる技術はまだ存在していないといっていいでしょう。なにがしかのシステムとしてインフォメーション・アーキテクチャを構築する際に、分類とメタデータが意味を成すのはそのためだといえます。人には経験的に理解できても、システムは言語システムを理解できない。本は自分自身に記載された言語を理解していませんし、ITシステムでもそれは現時点では同じです。データベースにしても、HTML上のマークアップにしても、人sがシステム上の言語を利用しやすいよう、あらかじめシステム側に言語を判別できるよう、準備しておくためのものです。
1冊の本の中でさえ、メタデータが機能している場合があります。章や段落のタイトルや注釈などです。それは人が見て、人が利用するものです。
しかし、HTMLに付与された多くのメタデータの中には、人が直接には利用しないものも多い。metaタグ内の情報のほとんどがそうですし、ほとんどのclass属性は直接的には人間のためとはいえないでしょう。もちろん、それをブラウザなどのシステム側で処理することによって、人が恩恵にあずかることができるので有用なことは間違いありませんが。
人がどう言語を利用しているかを理解すること
メタデータとデータの切り離しが「IA同士の関連付けを意識したとたん、重要な課題になるものだと考え」られ、その「ことは、逆にそれはヒトにとっては直接的な恩恵をもたらさないという意味でもあるということは忘れてはいけない」と書いたのはそのためです。おそらく人間が目の前にある情報を利用するだけなら、IAなどは不必要なのです。IAが必要なのは、人間が目の前にない情報も利用するための手段としてITのシステムが必要だからです。そのためにはシステムが人間の言語を人間が利用するように理解できるようにするためのIAが必要なのです。
そのため、IAに必要なのは、人がどう言語を利用、理解しているのかを知ることなのでしょう。適切な分類、適切なメタデータの付与のためには、それを人がどう理解し、利用するかがわかっていなくては、適切な設計ができないはずだと思うからです。もちろん、それは言語だけでなく、画像や音楽など、他の情報要素が対象になる場合でも同じです。
野球であれ、サッカーであれ、ボードゲーム、カードゲーム、テレビゲームであれ、そこにはルールの共有された場がなくては、ゲームは成り立ちません。世界のどこでもサッカーができるのは、ゲームの場が共有可能だからです。それは言語を共有していない人々のあいだでも成り立ちます。
前回、メタデータの起源は対象に名前をつけることだったことを紹介しました。では、何のためにIAは名前を必要とするのか? それは目の前にない文章を人が利用するときのために、それが必要だからなのではないでしょうか?
IAをやる人に必要なのは、目の前の文章にどうメタデータを付与するかということより、人が言語をどう利用、理解するのかを考えることなのでしょうね。
では、次回は「並び順・導線」について。
- 私的インフォメーション・アーキテクチャ考:0.何を行うのかの定義
- 私的インフォメーション・アーキテクチャ考:1.要素としての情報の種類
- 私的インフォメーション・アーキテクチャ考:2.構造と要素間の関係性:その概要
- 私的インフォメーション・アーキテクチャ考:3.構造と要素間の関係性:分類あるいはメタデータ:その1
関連エントリー
この記事へのコメント
yusuke
> 階層構造的な分類構造をイメージしているのではなく、ある独立したエンティティに対してそれを示す属性を付与する
これ、すごい正しいですね。モデル化でありがちなのは「人は霊長類 - ヒト科 - ホモサピエンス」であるという分類木的な考え方です。それが実際には分類の複雑さを招くことになるのはあまり気づかれていないように感じます。
> 実はデータとメタデータの区分はかなりあいまいになる
そうなんですよ。そのときに重要なのは関係(構造)であってデータではない。さらに時間軸を絡めるとかなり面白いことになります。
人が行なってきた言葉による記憶を外化は、言葉をリファレンス、想起させるトリガーとして扱うだけで、そのモノではないというのも重要なことでしょう。クオリアは、それ自体が実体ではなく記憶への入口だと感じます。
言葉の相対性は文脈や解釈、つまりその人や場や時間軸の構造によって生まれるものです。
その上でIAが背負う「絶対性」(言葉は1つ)な側面をどのように解決するのかが興味あります。
ま、人間の認知力は柔軟ですから、人間側に変化を強制する形に落ち着くのでしょうが(ある側面では)。
tanahashi
ちょっと思い浮かんだ(連想した)ことがあったので、新しいエントリーを立てました。
http://gitanez.seesaa.net/article/26670926.html