歴史知識学の方法と知識ベース
歴史知識学の方法と知識ベース
ーー東京大学史料編纂所での経験から
Ⅰ編纂と文化
まず編纂と文化ということから、お話をしたいと思います。私は、最近、『かぐや姫と王権神話』という本を執筆するにあたって、『竹取物語』の本文の校訂という仕事をしました。『竹取物語』には四・五カ所の「不審本文」といわれる、昔から意味不明の箇所がありまして、それについてこれまで編纂という仕事に従っていたものの立場から見直してみました。
編纂ということを考える上では、ちょうどよいので、そのうちの一つを題材として説明させていただきますと、たとえば、車持皇子が蓬莱の玉枝を偽造するという場面があります。彼が密かに偽造を担当する鍛冶工を集める場面が次のようにでてきます。
垣を三重にし籠めて、皇子も同じ所に籠り給ひて、知らせ給ひたる限り十六そをかみにくどをあけて玉の枝を作り給ふ。
これは少し漢字に起こしてありますが、原文ではすべてひらがなになっています。そのうち傍線の「十六そをかみにくどをあけて」という部分が意味不明なので、これまでたとえば、「領知する限りの十六所の荘園を」などと解釈されてきました。「十六そ」の「そ」は、「所」という字を崩した変体仮名で書いてありますので、これは「十六所」としてもいいのです。しかし、そこまではよいとしても、「かみにくどをあけて」というのは、どうしてもわからないという訳でした。
私は、まず「十六所」を生かすことを中心に考えますと、これは「十六所祈祷」の意味だろうと思いました。「十六そ」とは、伊勢神宮を中心として、近畿地方の有名な神社をえらんで、朝廷が祈祷することをいます。そうだとすると、「十六そをかみに」という傍点部分の「をかみ」は「拝み」の可能性がでてきます。「知る限りの十六所拝みに」となりますが、この「に」を「て」に変えてみます。変体仮名の書体によっては「に」と「て」は酷似する場合がありますので、これは許される校訂です。
こうして「知る限りの十六所拝みて、くどをあけて」という文章になりました。そして「くど」は「竈突」。つまり鎌倉時代の『名語記』という辞書には、家の竈神のそばにあける煙出をいうとありますので、「竈突=煙出」でしょう。神様に祈るためには、煙をあげなければならないという考え方は古くからありますので、まさにそれだということになります。こうしてこれまでわからないといわれていた文章について、「知っている限りの十六所の神社に祈祷をして」、潔齋をして玉枝作りにかかったということで、うまく意味が通ずる。一字、「に」を「て」に校訂するだけでうまくいったということになります。
もし、こう読めるとしますと、『竹取物語』の成立は九世紀の末と考えられておりますので、この史料は、十六所祈祷の初見史料になります。これは平安時代の宮廷神道の成立にかかわるたいへんに重要な発見問題となりってきます。
『竹取物語』の校訂というのは江戸時代からされているわけですが、もしかしたら、これで日本の文化の基礎について確実に一つの黄金の釘をうったということになります。編纂というのは、こういう意味では、歴史文化の基礎をつちかうものなのです。
Ⅱ史料編纂所の編纂事業と電算化のキッカケ
もちろん、編纂は、まずは人文社会科学における基礎研究です。自然科学でいえば「実験」にあたるきわめて地味な作業で、いわゆる「考証」にもとづいて研究情報をオープンする作業です。私の在職している史料編纂所は、体系的な考証の事業、編纂という事業をもっていますが、私は、それは自然科学の研究所が実験事業を行うのと同じような位置づけであると考えてきました。
これはたいへんに手間のかかる大事業です。まず、日本に残されている明治以前の歴史史料は、膨大な量にのぼります。おそらく東アジア随一でしょう。ところが、それらの史料は漢字と仮名が混在し、字種が無数に登り、毛筆の字体が多様であることもあって、解読が困難です。文字を読む作業は経験的な能力と訓練に支えられた器用仕事・手技で、その意味では、編纂者は最終的には「崩し字」をよむ職人というところがあります。
具体的な手順としては、私の担当している『大日本古文書』を例にして、とくに活字編纂というものの実際を御説明しますと、①文字復元、翻字、筆跡、朱、抹消形態の復元、校訂注の付与、②文脈復元、読点付与、③内容解釈、文書名付与、標出、説明注(地名人名など)、④「物」としての形態、料紙、付箋、接続関係など、⑤文字配列指定、改行、排列、本紙、裏紙、封紙、包紙、表裏、端裏、見返など、⑥図版、写真指定など、という相当手間のかかる作業となります。しかも、これはあくまでも史料編纂所の仕事の一部で、『大日本古文書』のほか、『大日本史料』『花押かゞみ』『日本関係海外史料』『幕末外国関係史料』などの諸種の出版物があります。そして史料の採訪、収集、管理などをふくめた、すべてのベースになる仕事があります。史料編纂所では、それをふくめてすべてがからまりあった集団作業になっています。
この事業は、非常に手間と人員がかかる地味な作業です。活字出版は、出版期限、訂正機会の少なさなどの諸条件の中で最善の努力を行うことを強制する、たいへんストレスの強い仕事です。仕事というものは、実際には、どのような場合もストレスがないと前進しないというところがありますし、厳密性のためには一度活字にして修正できない状況に自分を追い込むことが必要です。ですから、こういう活字出版は最後まで残るとは思うのですが、しかし、史料編纂所では、ここ二〇年ほど、編纂に情報学的諸手段を導入する試みをしてきました。
これはいくつかの理由がありましたが、大きかったのは、第一に史料編纂所に存在する史料の目録データを作成し、史料のデジタル画像データを作成していく動きの先行です。それは私も一時代表をしました「古文書目録データベース」に始まりましたが、次ぎに「史料所蔵目録データベース」(HICAT)がライブラリーデータベースとしてシステム化されました。さらに大きかったのは、『大日本古記録』『大日本古文書』をフルテキストデータにする事業が進んだことです。これらによって、史料を広く検索することが可能となり、さらに索引データが簡便にとれるということが、編纂の仕事に大きな影響をあたえました。これによって活字編纂が正確になるということが明らかとなり、その意味では、仕事上、電算化を進めざるをえないということになったのです。
第二に大きかったのは、印刷体制が活版印刷から電算写植に変わっていったことです。つまり、まず活版印刷から電算写植への変化が起きました。そうしますと、せっかく電算データがあるのならば、それをDatabase化しようという動きになりました。前近代日本史情報国際センターの設立によって、現在では、すべての印刷物について電算データを利用して、それをDatabase化することが実現しています。
第三に、今後、根本的な影響をあたえると思われるのは、まずマイクロカメラ、次ぎに印画紙の生産が終了したことで、これによって最初からデジタルカメラで撮影する、いわゆるボーンデジタルの体制に移行せざるをえなくなりました。史料編纂所では、今年度、この体制に移行しました。それにともなって、すでに撮影してある大量の写真帳のマイクロフィルムのデジタル化の事業も進みました。写真のデジタル化は、史料蒐集という編纂作業の根っこのところからの大きな変化です。
以上は、人文系の研究所としては本当に大変な仕事であったと思います。私は、自分のPCもキチンとあつかえない前世代の人間で、もちろん、自分の編纂物との関係や役職上では要求される努力をしましたが、これに尽力された方々の費消した研究時間は、個人としても研究所としても決して忘れることができない問題です。
もちろん、それはただ便利にするということではありません。今申し上げましたように、一字の理解が神道史や王権論の理解に関わってくる訳ですから、基礎研究としての編纂から一挙に先端研究に展開することもありうる訳です。研究所としては、そういう基礎研究と先端研究を結合する手段として、歴史情報学を本格的に導入するというつもりでやってきたということができると思います。もちろん、それは単に大学の一つの研究所の利害ではなく、学界会全体が基礎研究とともに、それらの研究情報のネットワークによる共有の上にたって、活発な研究を実施できるようにするためであることはいうまでもありません。
人文情報学の先生方に、この点を御理解いただいて、今後とも、さまざまな協力をお願いしたいと思います。それを前提にして、史料編纂所で、最近、議論するようになりました歴史知識学、歴史知識ベースというものの、発想や現状について、若干の報告をしたいと思います。
Ⅲ編纂とは何かー典拠史料集合と知識要素
まず、編纂の電算化それ自体をどうみるかということについて少しふれてみたいと思いますが、上に述べましたように、このような事業の発展は、実際には、なかばは客観的な条件に押され、技術と機器の変化に促進されて進んだという要素が強かったように思います。そういうことですので、率直にいうならば、この方向には研究所内でもまだまだ十分な合意がないという側面もあります。最初は、私なども、編纂の情報化に積極的に加わるというのではなく、相当の留保をしてきました。ようするに十分な体制がないままで、巨大なシステムをかかえざるをえない。そして、システムからの、研究上、編纂上の受益は、個人の研究や部門研究によってしばしば大きく異なっています。
もちろん、システムの維持・運営の負担は客観的に存在し、またどの場合でも受益はあるのですが、実際上、仕事と情報化の関係が多様である以上、歴史情報学に対して、どういうスタンスをとるかは実に多様になりますし、それが労力ということになればいよいよです。この意味で編纂の情報化について十分な合意がないといわざるをえないような側面は、普通の人文社会系の研究所としては自然なことであったと考えます。史料編纂所はきわめて長い歴史をもった伝統的な研究所でありながら、情報処理の側面においても、他の諸機関にはないような実績を積み上げてきました。その基礎には複雑な実務をふくむ編纂という職責をもつ研究者が、基本的に情報化に前進的であるとはいうことがあったと思います。そうはいっても、実際上、多様な意見が存在する訳で、これは御協力をいただいている人文情報学の先生方には、是非、御理解いただきたい問題です。
もちろん、編纂の電算化を突き動かしたのは、右にも触れたような編纂の正確性と速度を増そうという職能意思でした。実感的にいいますと、これには誰も抵抗することはできませんでした。けれども、これを、どうにか研究所の活性をます方向で、研究所の若手研究者が将来に希望がもてるようにしよう、そしてそれは必然的に学界のためにもなるだろうと考えて前に進むというのは、実際にはたいへんに困難であったということです。
歴史知識ベースという考え方は、ここから生まれてきたということができると思います。つまり、「編纂」の仕事というものを見直すという議論、編纂の本質というものをまず考え直すという過程がないといけないだろうというのが、私の考え方でした。編纂の中心には正確に史料を読み、文字に翻刻するということがあり、それはその通りなのですが、電算化を前提に編纂過程を見直そうとすると、その全体像を考えておかねばならないということです。
そもそも歴史の研究は、史料から歴史の実態を読みとる、史料の向こう側に存在する歴史的社会の復元ということが最終的な課題です。編纂は、それを視野に入れるのですが、それを直接の課題とするのではありません。編纂は、むしろ、できるかぎり禁欲して、史料それ自身の中に視野を限定するという手法をとります。史料は歴史的社会の実態が、そこに反映している一つの現象であるというように考えますと、編纂というのは、すぐに実態の研究を目指すのではなく、現象としての史料に執着する、いわば「現象学」であるということです。そういうことですので、編纂という特殊な基礎研究は、テキストの世界のすべてを細大漏らさず、データに研究上の価値の軽重をおかずに、ともかくも知り尽すということが中心になります。
そのような編纂という仕事の手順を追ってみますと、まず第一には、史料テキストの特定の記述に関係する典拠史料の集合を作りだす作業です。これは前提としては、蒐集・記録・保存などのさまざまな作業が入る訳ですが、ここでの問題は、そのようなアーカイヴズと重なる機能ではなく、編纂記述の典拠となる史料の集合を、史料の種類、その物理的な形態を越えて作り出すということにあります。これは、歴史の研究者・編纂者は、普通、頭の中でやり、メモやカードにして残すという形でやっています。編纂も同じことなのですが、編纂作業の場合は、その記憶・メモ・カードの量が多く、種種雑多になり、そのメモ・カードの管理に相当のエネルギーを使います。しかも、これは徐々に増大していき、研究・編纂の進展によって整理・蓄積されなければならない訳ですから、この典拠史料を維持管理する作業は相当の負担になります。
第二は、こういう形で、テキストに即して読んでいきますと、テキスト記述の中に、共通して出てくる言葉にそくした知識が形成されてきます。普通、歴史学者は、こういう共通知識のメモのことを道具などといいます。たとえば、人名・地名・官位・制度など、さまざまな「ヒト・コト・モノ」に関する関係知識を獲得、発見、補充、管理する作業。カードでいえば、最初のカードは史料のテキスト記述にそくしたカードで史料集合そのものなのですが、今度は、そのカードをカードに載っている記述の知識内容にそくした形で並べ替えたり、作り直したりします。そして、カードを整理して、その集合の中の脈絡をおっていくと、同じ言葉で小グループができてきます。
この作業によって、当面の編纂について必要なことが満足できれば、一応、作業はそこで終わるのですが、将来の編纂を見越して、そして編纂の道具を作っておくという観点から、同じ種類のカードを、今度は意識的に蓄積しようとすることもあります。もちろん、編纂は先端的な研究それ自身ではありませんから、基本的には現象学の範囲で一応終わらせておいて、また必要が出てきたときに追補するというペースになりますが、いずれにせよ、相当の知識が徐々に形成されてきます。
そして第三に重要になるのは、これらの個人的な作業の結果として形成されてきた典拠史料集合と歴史知識のカードを集団的に交流・蓄積する作業です。個人的な作業は、カードなどという形で物質化されていても、実際にはどうしても個人の頭脳と記憶そのものによってまとまっているというのが事実ですから、知識は、実際には、この集団過程に入ることによって形を整えることになります。史料編纂所のような職場ですと、これは普通、隣の部屋や問題や時代に関係する部屋にいって問い合わせるということになりますが、当然のことですが、ある程度まで調べきったところでなければ人には聞けません。どの分野でもそうでしょうが、こういう知識交換の関係は、相互の研究者としての人間的な交流を媒介にした長期的な関係によって補充されるということになります。
もちろん、編纂は、歴史の研究者ならば誰でもやることです。しかし、詳細な編纂を合理的に進めるためには、相当の施設が必要ですし、編纂者のみでなく、原本の蒐集・保存に必要な技術・図書関係のスタッフが必要となります。さらに、そういう条件を別としても編纂過程に即していえば、この集団的な基礎研究過程、知識の交流・蓄積の側面は欠くことができません。史料編纂所のような研究所が必要である理由は、本質的には、この点になります。
Ⅳ歴史知識システム構想の概略
史料編纂所などは、当然のことながら学界のためにある訳ですから、その関係では編纂については論ずべきさまざまな問題があります。しかし、以上の簡単な概観によれば、ともかく、基礎研究過程としての編纂とは、とくにそれが一貫した作業、集団的な作業である場合には、(1)典拠史料集合の形成、(2)歴史知識の抽出、(3)それらの集団的な管理と高度化という三つの要素からなるということです。
そして、これらを情報学的に合理化して装備するものとして、「知識ベース」の構築というテーマが考えられた訳です。これを先行的に実現し、必要な実験をするために、2006年四月、史料編纂所に前近代日本史情報国際センターが設置されました。
以下、この前近代日本史情報国際センターにからんで、私も関わったシステムを中心に、その概略を述べることになりますが、これはあくまでも私見であるということをまず御断りしておきたいと思います。私の関わりは、基本的に事務的なもので、実際の開発は、前近代日本史情報国際センターの教員と、以下に名前のあがるような助教のみなさんの仕事です。その意味では今日の報告を私が行うのはふさわしくありませんので、御断りしたのですが、現在、史料編纂所の情報関係者はリプレース作業に忙殺されていますので、依頼されれば断る訳にいかずでてきたものです。その点で、報告に適任でないこと、また報告は私見にすぎず、不十分な点が多いことを、かさねて御断りしておきたいと思います。
①翻刻支援システム
まず第一は、翻刻ツールの共有ということでした。これは、右に述べましたように、史料写真のデジタル化とサーバ管理が進み、史料写真へのアクセス・閲覧環境が共通化していくであろうという予想を前提としています。現在でもコンピュータの道具としての利用にたけた若手の間では、史料のデジタル写真を画面表示し、それをみながら史料原稿を作成するという場合が発生しています。そのような翻刻を同じシステムで行えば、データや知識の共有は非常にやりやすくなるであろうという訳です。
これは北海道大学の田中譲先生の開発された文書画像解析システム、トランスメディアの利用も視野に入れて、情報学では、前近代日本史情報国際センター(当時)の山田太造助教、歴史学では史料編纂所の井上聡助教を中心に、「翻刻支援システム」という形でできあがっております。
なお、参考のために、私の担当しています『真珠庵文書』の写真を翻刻支援システムに読み込んだ状態を図①に掲げておきました。これはシステム開発以前に編纂したものですが、その刊本組み版も参考のために図② として掲げてあります。
今後、さらに利用の普遍性を高めるべき点もあると思いますが、(イ)改行データを残す、(ロ)(井上助教の開発にかかる)電子崩し字辞書と連携し、さらに似た字検索を可能にする、(ハ)地名・人名のアノテーションをタグで付与できるなどの機能を有しています。これによって、目録ー写真ーテキストと連携して、データを蓄積・共有したいということになります。
ただ、ここで確認しておきたいのは、このシステムは、あくまでも研究組織、あるいは将来的に必要ということになれば学界グループの中で共有される編纂メモとして構想されているもので、その意味では作り込みを最小限のものとしたいと考えてきました。その史料に関するアーカイヴズ的なデータのデータ集成管理台帳のようなものは目指していないということです。
またもう一つは、これはいわゆるDTPシステムを作るのとは違うということです。もちろん、電算印刷のさいに印刷所に、印刷用のタグなどのまったくはいっていない素打ちのテキストデータを提供するということはできる訳ですが、やるとしてもそこまでということです。むしろ重視したいのは、地名・人名などについてのアノテーションデータを次に述べる知識タグの中に統合していくことだと考えています。
②系譜情報システム
次に具体的な知識タグのシステムとして、前近代日本史情報国際センターの枠組みの中で開発したのは、「系譜情報システム」と呼ばれるものです。いうまでもないことですが、各種編纂作業の基本は人名情報の調査となります。これについては、最初は大量に蓄積されたフルテキストデータそれ自身に簡単なタグを付与していくシステム、あるいは何らかの形で刊本原稿段階から電算データ受け入れの段階でタグをつけていくシステムを構想したのですが、実際には、まず大量の人名情報自身をデータベース化するという試みから出発することになりました。つまり、日本史の史料には、大量の系図・系譜・補任などが存在します。そこからID付人名DBを構築し、その後に、目録・fulltextの人名テキストのネームタグを設計して、できれば、将来、双方を結びつけようという順序となりました。
対象とした系図は『尊卑分脈』と『寛政重修諸家譜』の二つで、図③にPDFから項目を切ってID付きの人名データを作成していくための画面、そして図④に履歴情報を一覧表示する画面を掲げておきました。氏・姓・家・家ID、名・読み、呼び名、父母、配偶者、履歴(基本・官位・領知など)のデータを切り出せるようになっています。担当は、前近代日本史情報国際センターの赤石美奈准教授(先端研・工学部より兼任)、そして史料編纂所の木村直樹助教、遠藤珠紀助教の三人です。
たとえば『尊卑分脈』(全四冊)には約8万の人名項目がありますが、これは(異名など)大量のダブりを含んでおりますので、それを整理しながら、現在、現在、1・4巻をデータ化し、約4万まで人名IDを整理してきています。これが完成すれば奈良時代から江戸時代にかけての巨大な人名データベースができる訳ですが、ここでも注意しておきたいのは、このシステムの目的は決して人名データベースを作ることにはないということです。
これはあくまでも編纂の際に人名の確定などのために調査をした結果を研究組織の中に蓄積し、人名関係の編纂を合理化することが目的です。そして、将来的には、それを学界で共有できればもっともよいということですが、完成したデータベースや辞典などを作ろうということではありません。これはそういう固定した知識のためではなく、あくまでも学界共有の研究用具として構想されているものです。
③地名システム
次は、地名システムですが、これは前近代日本史情報国際センターの枠組みの中ではなく、史料編纂所に早くから設置されています画像史料解析センターの枠内で実現されたものです。
そこで、ここでは西田友広助教の「荘園絵図プロジェクトの活動と課題」(画像史料解析センター通信49号)、井上聡助教の「荘園絵図現地調査の現状と編纂所における地理情報活用の方向性」(荘園絵図に基づく地理情報システム構築研究会、2010年12月21日。於史料編纂所)の内容を簡単に御報告するにとどめます。
このシステムの目的は、西田報告が「史料目録・fulltextにAPIを活用してジオタグを挿入し、HTMLからGoogle-mapを活用して史料分布を表示する」といい、井上報告が「SHIPS-DBの地名テキストを典拠情報と共に抽出し、地理メタ情報を付加して蓄積するシステム」といっていることで明瞭です。図⑤として試験的なシステム画面も提示しておきました。
画像史料解析センターの事業としては、有名な東郷荘絵図などの利用もあるのですが、このシステムの基本は、地図上の特定地点に関係史料を蓄積する、地図をいわばコンテナにして、史料を集積していく実務システムであるといってよいと思います。しかし、こういう単純な実務システムによって、史料編纂所が蓄積している大量の地名情報をふくむフルテキストさらには画像を一覧できるようになれば、その効果は抜群でだろうと思います。このためには、史料中に登場する地名に国郡・荘郷名などを充てていくタグシステムが前提となることはいうまでもありません。
なお、このシステムは、鳥取県を焦点として進められていますが、その際、。(この「。」はとる)史料所在情報・関連史料目録情報については鳥取県史編纂室から提供をうけています(共同研究員、岡村吉彦氏)。これは後に述べるアーカイヴズとライブラリーの関係でも重要な達成であると考えられます。
④言語分析の可能性
以上は、システムとして開発中のものですが、実際上、史料編纂所の既存のデータベースシステムでも相当の知識分析の可能性が存在しています。手順としては、それを確認するところから議論を始めるべきであったかも知れませんが、これは日本前近代史の研究者、とくに史料編纂所に蓄積された相当量の電子データを利用することが当然の研究作業の一部になっている平安時代から室町時代の研究者にとっては当然のことですので、ことあたらしく議論する必要を感じないというところもあります。ただ、歴史学と人文情報学の関係の基礎にも関わることですので、これについても、私の経験にそって御話ししたいと思います。
史料編纂所のフルテキストデータベースは、『平安遺文』の全文システム以降、検索対象語を中央にそろえて、その前後10字の「文脈」コンテキストの中で表示するシステムになっています。これはヨーロッパ歴史学の中で、非常に早い時期からコンピュータの利用を行ったベルギーの歴史家、レオポール・ジェニコが『歴史学の伝統と革新』(森本芳樹訳、九州大学出版会)で述べたシステムにならったもので、コンコーダンスシステムと呼んでいました。これによって、ある歴史用語を前後一〇字という限定したレヴェルですが、コンテキストの中で示すということが可能になります。そして、実際には、現在のレヴェルでの一般的研究を進めるためならば、それで相当すんでしまうという側面がある訳です。
図⑥に掲げましたのは、『平安遺文』システムで「下地」という語に検索を懸けた様子です。「下地」というのは「下地中分」という言葉をご存じと思いますが、鎌倉時代、荘園の土地を本所と地頭の間で分割するときに、その土地のことを「下地」といっています。ところが、その最初の意味は、『和名抄』という10世紀の辞書による限りでは、壁の下地という意味です。右の検索結果画面の10番の史料にも、その意味で登場していることがわかると思います。ほかにも漆器の塗りの下地などと使う訳で、これはどうも手工業からでた言葉であるかに思われます。そしてそういう意味から、「素質・基礎・準備」という意味に展開します。醤油のことを「したぢ」というのも味付けの基礎という意味です。
こういう「準備・したぢ」としての土地という用語としては、一一世紀までは、敷地という用語が使われていました。『字訓』(白川静)によれば、「『敷く』とは草や布などを下に敷きつらねること、そのように敷き広めて広い地域を治め『領く』ことをいう。『占む』『領る』も同源の語」ということで、そういう意味で敷地という言葉が通用していた訳です。『字訓』によっても敷地と下地が「基礎」という意味で共通することがわかるかと思います。
用例を調べてみると、この敷地という言葉に交代するようにして「下地」というの言葉が一般的になっていくようです。右の検索結果画面にもどりますと、「削除」としたところは、こういう下地の語義からして、下地の検索結果としては削除すべきものです。まず上から二番目のデータは、(このコンコーダンス画面ではみえませんが)「夫用途弐百弐拾伍文」などという、この時代では使用されない用語をふくんでいますから、偽文書であることがわかります。三番目は「下知」を「下地」と誤記したもので、排除する必要があります。さらに六番目の「簗下地」というのは「簗下の地」と読むのだと思いますし、八番目も同じように地名です。
それですから、土地としての下地の用例としては、四番と七番しか残らない訳で、この時代が、敷地という言葉の用例が減少していく、ちょうど一一世紀になるのです。ようするに、土地としての下地というのは、都市手工業に根をもつ用語で、占有・利用可能な有用性をもった土地、下ごしらえの済んだ土地という意味で、そのころ以降に一般的に使用されるようになったということになります。
これは「土地範疇と地頭領主権」という論文で述べたことです。すでに昨年、校正を終えたところですので、詳しくはそれをみていただくほかないのですが、これは平安時代・鎌倉時代の土地制度の理解の全体に波及することになります。たとえば、下地というのは、利用可能な土地、開発された土地のことなのですから、「下地中分」とは、荘園の物理的な面積の中分ではない。開発が進めば、下地の総量が変わっていくのは当然であることが自然に理解できることになります。
私は、この問題をおそらく二〇年ほど考えていましたから、かならずしもデータベースのお陰をこうむってきた訳ではありませんが、しかし、論文にする時のスピードや周辺調査の便宜のためには、データベースが大きな威力を発揮することを実感しました。とくにありがたかったのは、結局論文にはしなかった部分ですが、普通は研究対象にならないような細かな土地制度用度、条里制用語を調べることを赤石美奈先生と話していたところ、赤石先生が、フルテキストデータベースの検索結果画面をエクセルデータに展開するための簡単なマクロを組んで処理作成してくれたことです。
私はマクロは組めませんのでだめですが、これによって個人個人の研究者に大きな便宜があたえられると思います。これは梅棹忠夫氏が提案したカード方式に変わるような研究ツールとなるのではないかと実感しました。このような方向は、将来的には、データベースの展開や知識ベースの展開方向に大きな影響をあたえるものと考えています。
そして、いうまでもないことですが、こういう語義分析は、情報学の通則としての言葉の共起性の分析、そしてそれにもとづく言語体系とその変化の分析につながっていきます。正直いって、まだ問題はそこまでは進んでいませんが、オフラインでの語義分析の結果をデータベースに返戻するということになれば、たとえば上記の検索結果画面で「削除」としたものはキーワードとしての「下地」のリストから排除されることになります。誤記などのゴミも排除されることになります。そして、編纂の観点からいいますと、「下地」の早い例となる文書は偽文書であるということを申し上げましたが、これによって偽文書推定も可能になるかもしれません。偽文書確定の問題は日本ではそんなに大きくないように思いますが、ジェニコジョニコのシステムは、その点を大きな目標としていたことも想起されます。
なお、人文情報学との関係で申し上げておきたいのは、これはいわゆるターミノロジーの問題に関係してくることです。私は、学術の役割がパラダイムを作るのではなく、最終的には知の体系の中に文化を豊かにするものとしてのターミノロジーを作り出していくことであると考えていますが、そういう意味で人文情報学の最後の言葉としてのターミノロジーに、この問題は結びついてくると思うのです。
Ⅴ歴史知識共有のネットワークと学術表現の将来
史料編纂所での経験にそくした報告は以上で終わりですが、以上を基礎として、人文社会科学の情報化の波に最初にぶつかった世代の研究者の一人として、若干のことを述べさせていただきたいと思います。
①歴史学の巨大科学化
歴史学においては、この間、膨大な史料にもとづく研究の複雑化が進み、これによって研究の現状が社会の側にみえなくなっています。それは研究者自身にとってもそういうことで、時々刻々大量の論文が作成され、全体の俯瞰が困難になっています。こそれはまえからそうなのですが、最近の状況ですと、それは語義分析、個人史分析、さらには筆跡分析や史料素材としての和紙分析にまで、いわば研究方法のミクロ化ともいうべき方向事態が展開しています。
だいたい歴史学というのは一方で「無思想」性を必要とする、しかし、他方で「無思想」では全体をとらえることはできないというのが、永原慶二氏など、私たちの先輩が強調したことですが、こういう状況の中で、その二律背反的な矛盾はさらに深まっています。
上で述べてきたような歴史知識学や知識ベースの構想は、研究者自身が、研究の進展の全体を自己管理し、確実な集団知を自由に作り上げていくための実験という性格をもっています。私は、これは客観的には、かって黒田俊雄氏が述べたように、歴史科学も巨大科学となりつつあり、その中枢に集団知を作っていくという構えをもたなければならないということを意味していると思います。研究方法のミクロ化と科学の巨大科学化というのは、自然科学と同じということです。っていっており、それに即した巨大科学を含みこんだアカデミーは、それを覚悟し、情報化を中心に研究と事業の拡大を進めなければならない。そのような覚悟なしに、アカデミーは生き残れないというのは、理系などでは研究者の常識でしょう。それは歴史学でも同じことです。
人文情報学の研究者は、巨大科学の現実を知り、そのような意味での社会的常識もお持ちですから、人文社会系研究における巨大科学の中枢機能としての集団知の組織形態を構想してほしいと思うのです。これは個人的な研究過程における知識発見システムを越えた問題です。
私は、その場合、相対的に真面目で地味な歴史学者は、絶好の実験材料であると言い続けてきました。歴史学者の集団のレヴェルを前提にした場合、個人による先端的な知識発見ではなく、実務用の単純システムの安定的な確保が焦点となります。その意味でも編纂事業は有益な実験材料であると思います。この点を御理解いただいて、情報学研究者には、情報学の初心をつねに確認しながら、歴史研究者の現実と研究実務を熟視していただくことを希望します。その際、た上で、直接の情報学的な意味、システムの高度化、作り込みでなく、システムの維持、さらに何よりも蓄積してきた膨大なデータの保守責任を共有し、システムの安定性・単純性を重視し、そういう立場から歴史学の研究者を教育してほしいと感じています。
②歴史学の学術表現の将来
このような巨大科学化の中で、歴史学における学術表現が大きく変わっていき、おそらく、現在、自然科学で一般的になっているような学術生産物の全面的なデジタル化が実現することは必然的ななりゆきでしょう。
もちろん、歴史学のカバーする領域は広大ですから、世界史の各時代、各地域ということを考えれば、刊本の形態をとって発行される良質な歴史関係著作物はむしろ増大するでしょう。とくに先端的な方法論や歴史叙述をブック形態で享受する欲求が消えるとは考えられません。事実の考証のレヴェルでの論文は知識データベースの充実という形で処理され、人名情報、制度情報、地域情報、事件情報などの相当部分も知識ベースの多様な可視化の中で提供されることになるでしょう。論文やブック形態は、データベース・知識ベースには反映できないもの、逆にいえばそのレヴェルを越えるものに限って提供されることになるでしょう。ここではじめて「良書が悪書を追放する」ということが起こるかもしれません。
こういう状況は、自然科学とは大きく異なっています。しかし、雑誌論文は自然科学と同様、早晩、すべて電子ジャーナルで提供されることになるに違いありません。そして、日本のアカデミーに特有な現象である個人論文集のブック形態での出版という風習も消滅するでしょう。さらに史料写真やテキストの扱いはすべてデジタル化が基本となることはほとんど疑いないように思います。論文の典拠史料はリンク付きでテキスト・画像の両者がオープンにされるということになるかもしれません。その中で、現在、活字形態で出版されざるをえない史料集も、デジタル化が基本となる時期がくるでしょう。刊本史料集がすべてなくなるとは考えられませんが、史料写真のリンクが付き、知識データも包含する方向で高度化された史料集が基本形態になるのではないでしょうか。しばしば個人あるいは機関所有のもとにある、文書・日記・絵画などの狭い意味での史料の画像のネットワークオープンは、社会的にはもっとも重たい問題ですが、国家の文明化・文化化が今よりもう少し進めば、それも解決される見通しがない訳ではないと思います。
これらは希望的な予測であるという意見もあるでしょうが、しかし、現代社会は、日本のみでなく世界各地の歴史情報を、毎日、大量に提供しており、その中で歴史学が社会的有効性を発揮するためには、これはさけられない道だと思います。歴史学が社会的責務を果たすためには、歴史知識を共有する場を、コンピュータネットワークという形の外部脳の体系の中に移し、それを研究者集団が自治的・職能的に共有するほかないという時代がくるのではないでしょうか。
③自治体史をめぐる図書館との関係
人文情報学の研究者に、さらに考えていただきたいのは、このような歴史学の巨大科学化の社会的インフラストラクチャーです。それを問題にせざるをえないのは、歴史学にとっては、文書・日記・絵画・文学・遺物・遺跡・景観その他など多様な形態をとった史料の歴史学者による職能的取り扱いと保存、公開が必須だからです。
ここでは、史料編纂所で始まった社会連携講座「図書館等所蔵史料の調査・整備研究」(代表、石川徹也客員教授)に関わって、問題を提出したいと思いますが、この社会連携講座では、日本のほとんどの自治体が編纂した、その自治体の「通史」と「史料集」いうものを対象にしています。この「通史」と「史料集」の間には、いうまでもないことですが、通史の歴史叙述とその典拠史料あるいは典拠史料群の関係という形で、内容上のリンクがあります。さきほどの編纂と知識ベースについての議論でいえば、該当の通史叙述は典拠史料から抽出した、その地域についての歴史知識である訳です。
この知識と典拠史料の関係をライブラリアンの仕事の流れにそって組織して、市民サービスができないかというのが、この社会連携講座の基本的な発想だと、私は理解しています。つまり、市民が通史叙述に興味をもったり、疑問をもったりします。あるいは小中学校や高校の教育で教師が、地域の歴史を教材とする場合に授業計画のためには相当の調査が必要です。そのときに、図書館にいって、ライブラリアンに「自治体史」という本についてのリファレンスを求めることはありうることだと思います。
なにしろ自治体史は、発行点数が限られていて、しかも相当前の出版であるのが一般ですから、それを見るためには多くの市民は図書館に行く訳です。自治体が税金を使って発行した本について、自治体のライブラリアンがリファレンスをするというのは自然なことではないでしょうか。また多くの場合、自治体史を編纂した編纂委員会などは解散しているのが一般ですが、その編纂史料などは残っている場合もあると思います。さらに図書館にはしばしば郷土史のコーナーがあることがありますが、その場合などはさらに自然なサービスになると思います。
そして、この場合、通史本文と史料集のフルテキストがあれば、通史叙述の特定箇所と、典拠史料群との間にライブラリアンが簡単にリンクを張れるようにシステム化をしておけば、リファレンスのたびにリンクが増えていくということになると思います。県立・市立レヴェルの伝統ある図書館ですと、地域史料が図書館に所蔵されている場合もある訳ですが、そういう時は、史料画像へのリンクを張ることができる訳です。前述の史料画像のネットワークオープンは、こういうところから一歩一歩実現していくものなのかもしれません。
図⑦にこの仕事の流れを簡単な図にしてみましたが、ライブラリが正面に立って、そのバックヤードをアカデミー(大学)とアーカイヴズ(文書館)がささえるという構図が描けると思います。研究や史料管理そのものをライブラリアンの職能と無関係に御願いすることできませんが、こういう形での異なる職能間での知的ネットワークは望ましいものではないかと思います。日本の自治体は、率直にいって「国」よりも健康で真面目なところがありまして、自治体史を作っている自治体はほとんど無数です。これらの自治体史の通史と史料集がフルテキスト化され、十分なリンクがアカデミーやアーカイヴズにも張られるとすると、歴史文化や歴史研究の地盤が一挙に深くなるように思います。それは狭い意味での歴史学にとどまらない意味をもつことになるに違いありません。
④知識をめぐる職能的共同
図⑧は、以上のような動きを、仕事の流れということでなく、知識をめぐる職能的共同というレヴェルで図を描いてみたものです。知識ベースということを広く考えた場合には、このレヴェルの問題までも注意しておく必要があるのだろうと思います。
とはいっても、現在は、まずは実際の編纂過程の中における知識ベースの実務システムの概略を作る段階にあります。情報学研究者にとっては、このような大規模な社会的問題への展開は本意とするところでしょうが、現実の段階からすると、アカデミーとライブラリの協同をめぐるシステムは、本来は、もう少し先になってから、立ち向かうことにした方がよいのではないかとも考えました。
もちろん、史料編纂所では、以前からその社会連携の一部として自治体史との協力研究体制の枠組みをもっています。その意味ではこれは実際に当面している問題です。また、ライブラリーと歴史の研究機関との協同ということになりますと、ライブラリーが原史料を所蔵している場合、その多くは江戸時代の郷土史料であるという問題があります。周知のように、江戸時代の文書史料はきわめて多く、それがテキスト・画像のデジタル化の最大の隘路になっています。そういう状況の中で、ライブラリーとの協同という問題が江戸時代研究の側からでてきたことは前進的な問題提起でした。たしかに江戸時代史料ということを考えると、こういう視野が必然となるのかもしれません。
歴史学のアカデミーは、日本の歴史文化の貧困さ、史料や遺跡・文化財を粗末にする日本の文教政策に対して、怒りに近い感情をもっています。これまで、それは日本にアーカイヴズを根づかせようという運動や、遺跡保存運動などという形で表現されてきました。しかし、それらは全体的な戦略の下でとり組まれてきたというよりも、基本的に問題にそくして個々に展開してきたという構図は否定しがたいと思います。それに対して、ここで問題にしたいのは学術的なネットワーク、あるいは現状の日本における知のネットワークの全体を考えた場合、ライブラリーとの関係がきわめて重要な位置をもつのではないかということです。
いうまでもないことですが、日本の現代社会の中で、もっとも濃密に発展した知的ネットワークは、県市町村の図書館のネットワークです。日本社会はたしかにアーカイヴズ不在で、少なくとも理念と行政原則という点からみると、その実情が東アジアの諸国と比較してもきわめてお寒いものであることはよく知られています。しかし、視点をかえてみると、日本のライブラリーネットワークの実力、つまり現代的な知の体系の相当部分を反映した蔵書をもち、きめ細かく構築された図書館網が市民サーヴィスに取り組んでいるという状況は、東アジア諸国の中でも抜群のものがあります。
なお、この問題は、学術文化の高度情報化の中でライブラリーの役割をどう考えるか、ライブラリアンの専門性をどう考えるかなどライブラリーの側の問題でもあると思います。そして、アメリカではライブラリー・アーカイヴズ・ミューゼアムの融合ともいうべき状況が問題になっていると伝えられていることも参考になるかもしれないと思います。
⑤国際的学術ネットワークと知識ベース
このような諸問題は、さらに広がって、国際的な学術ネットワークのあり方にも関わってきます。ただ、ここではすでに紙幅もありませんので、最近、ボン大学のタランチェフスキー氏からいただいた”Contents Business and Shared Cultural Assets in East Asia”というシンポジウムでの彼の報告の一部を引用しておくにとどめたいと思います。自然科学では、国際的な共同研究において、実験などの実務的な作業を協同することは普通のことですが、人文社会系では、どうしても狭い意味での研究会を開催することで終わりがちです。そうではない実務的な方向を考えていく上で、彼の提案は重要なものだと思います(なお、冒頭にでてくるHeとは私のことです)。
Several times he uttered his anger that the staff of the Historiographical Institute is not only overloaded with their every days work but in addition they are planning and implementing many projects from which North American and European scholars are profiting quite a lot, but that they seem to feel no need to do something from their side in return useful for their colleagues in Japan. The moral economy of give and take has become out of balance since considerable time.
He is conceiving what he calls a “Knowledge-Base of [premodern] History” (歴史知識ベース), which has to be based on an “Ontology of History Knowledge” and of related fields. The contents to be accumulated in this knowledge base system are what Hotate calls “half products” of historical research. Histories to be involved in this keen project are not especially determined by Hotate, but what in Bonn quite easily could be done is to integrate our considerable accumulation of Asia-Knowledge into such a knowledge base. In bringing in also our ancient and medieval history of Europe it should be feasible to give scientific research of a Eurasian history a new base of knowledge.
Digital Archives and historical databases ーDetlev Taranczewski
– Conference: Contents Business and Shared Cultural Assets in East Asia. Bonn, 3.-5. Dec. 2010
おわりに
さて、史料編纂所における前近代日本史情報国際センターの設立に関わってみて、個人的に興味をもったのは、知識ベースの技術的基礎とされているオントロジーという用語でした。
私たちの世代の人文社会系研究者ですと、この言葉はただちに三木清のオントロジー(存在論)ー→アントロポロジー(人間学)ー→イデオロギーという人間的意識の三段階論を想起させます。三木のオントロジーの議論はハイデカーの議論をうけたものですが、情報学が多用するオントロジーという用語もハイデカーをうけたものであることはいうまでもありません。
はるか昔に考えたことに戻れば、ハイデカーの存在論というのは、存在が意識に現象する局面を追求するという意味では存在現象意識学というべきもので、私などからすると、相当の問題があるようにみえます。しかし、編纂というのは「現象学」である、そのようなものとして禁欲的な性格をもった学問の手続き方法論であるという、前述のような意見からしますと、その限りでは、ハイデカーの議論の意味もわかる側面があります。その議論が、二〇世紀の諸学問分野で受け入れられた理由もわかるような気もします。
しかし、現在の段階では、学術情報のみでなく、情報というものが、単なる現象ではなく、その物質的な形態がコンピュータとネットワークという一つの独自の姿を取っています。それ故に、非常に一般的な言い方となりますが、物資的な情報過程それ自身と本来的な意味でのオントロジー、つまり存在論あるいは実在論の問題として考えなければならないということだと思います。それ故に、歴史学の立場としては、歴史的実在の分析、知識生産と情報化が世界史的な諸変化の中で、どのような位置があるのかという歴史学的な分析が必要になっているように思います。
これについての私見は、以前書きました「情報と記憶」という論文で考えてみたことがありますので、それを御参照いただければと思います。ただ、さきほど三木清の名前を出しましたので、やはり私たちの世代にとっては記憶に残る哲学者である中井正一の情報論について注意を喚起しておきたいと思います。中井正一は戦後、国会図書館の副館長として国会図書館の基礎を作ったという意味でも、今日の報告の最後にふれておくことが適当のように思うからです。
中井の見解で興味深いのは、非常に包括的な世界史的な情報過程論が提出されていることです(中井「委員会の論理」)。中井はマスコミュニケーション論の先駆者としても著名ですから、人文情報学の方はよくご存じのことと思いますが、中井の図式は、「古代」を「言われる論理=弁論の論理」、「中世」を「書かれる論理=瞑想の論理」、「近世」を「印刷される論理=経験の論理」と考えるというものです。中井の死去という不運もあって、これは本当のデッサンにおわっているのですが、神話的思考からの自立が音声と弁論を中心とすること、瞑想と内観を本質とする世界宗教が「羊皮紙(経典・SCROLL)に書くこと」「経典」の共有によって可能になったこと、近代科学につらなる「外部記憶の道具」としての「BOOK」形態が中国宋代に発明され、経験と技術の基礎となったことなど、私流にいいますと、社会的分業の世界史的な展開を知的・精神的生産の側から鳥瞰したものとしていまでも説得的なものと思います。
これに対応していえば、「Computerの論理」は「データベースとnetwork」を前提とした「外部脳の論理」であるということになると思います。これは社会関係と人間関係の機械化、あるいはその最悪の形態としての商品化ということではありません。むしろ逆に、外部脳をもつことによって、心の内側を熟視することが可能になるという内面性の時代、中井の言い方でいえば新しい瞑想の時代が期待されているということでしょう。
これは同時に、現代資本主義社会が、無政府的・無意識的に作ってきたネットワークを、情報ツールによって可視化し、それを意識的な活動の前提とするという意味では、「連携」の時代への期待ということでもあると思います。今日の報告の最後に述べましたアカデミーとライブラリーの協同ということにそくしていえば、それはコミュニティ(地縁・血縁)とアソシエーション(職能性と専門性)という二つのスタイルでの連携ということになるでしょうか。今日の報告では歴史学を中心に述べてきた訳ですが、このような意味で、歴史学に限らず、アカデミーの全体が、専門的な社会的職能の一環として、「Computerの論理」について、おのおのの学問の性格にそくして考えていく必要があると思います。