II.目録記述におけるインターネット上の情報資源の記述法 −メタデータを中心に−

1. はじめに
 本検討項目は当初、目録データベースにおけるネットワーク情報資源(WWWページや電子ジャーナル等)の記述法を念頭において設定されたものである。しかし、電子図書館活動のめざましい進展の中で、図書館目録の枠を超えて「メタデータ」が大きな注目をあびるようになってきた。よって本報告においても目録データベースのみにとらわれず、メタデータ一般について広く概観することとした。

2. メタデータの定義と必要性1) 4)
2.1 メタデータの定義
 メタデータとは、「データに関するデータ」もしくは「データに関する構造化されたデータ」と定義される極めて広義の概念である。図書館目録や雑誌記事索引のような書誌的情報はいうに及ばず、何らかの情報に対して二次的記述を行ったものと広く考えれば、辞書や書評などもその範疇に含めうる。記述対象となる情報資源も、その媒体や種類を問わない。
 しかし、現在メタデータが注目を浴びている背景には、ネットワーク情報資源の爆発的な増大によって起こった情報探索・利用の困難性という問題意識があり、「ネットワーク情報資源についての二次情報」に限って用いられる場合も多い。本稿では、現在の電子図書館システムにおける記述対象が必ずしもネットワーク情報資源に限られないことから、印刷物をはじめとする諸資料も含めて考える。

2.2 メタデータの必要性
 従来の図書館では目録なしには資料検索ができないが、既存資料のデジタル化やネットワーク情報資源の組織化をめざす電子図書館においては、全文テキストなどの一次情報を直接検索対象とすることも可能である。にもかかわらずメタデータ作成が必要となるのは、次のような理由による。
・より信頼度の高い検索
 統一された規則で内容を簡潔に表現したメタデータにより、全文検索よりも精度の高い検索結果が期待できる。また、キーワードに統制を加えることなどで、テキスト中での表現のゆれに影響されない検索ができる。
・本文には現れない情報の保持
 権利関係や他の情報との関連記述など、本文中には現れないが検索・利用上必要な情報を保持しておくことができる。
・様々な種類のデータを統合検索
 画像・映像・音声なども、メタデータを作成することによりテキスト情報と一括して検索することができる。
・既存媒体との統合検索
 電子図書館ですべての資料が閲覧できるのは遠い将来のことであるが、メタデータを適切に作れば、電子化された資料とそうでない資料を一括検索することができる。
 また、大学全体の情報化・電子化の中で、今後の大学図書館は、学内研究成果の情報発信や教育活動(遠隔教育や生涯教育も含む)へのより積極的な関与も進めていく必要があるが、こうした活動で作られる資料・情報にも適切なメタデータの付与が欠かせない。

3. Dublin Core (Dublin Core Meta data Element Set)1) 2) 3)
 Dublin Coreはネットワーク情報資源の発見を目的として提唱されたメタデータ記述規則である。様々な情報リソースに共通的なエレメント(データ項目)を設定しているので、汎用的な適用が可能である。また、もともと「文書的オブジェクト(Document Like Object)」を対象としていたことから、図書館で扱われる種類の情報とも親和性があり、電子図書館における情報記述規則として広まりつつある。いまなお発展途上ではあるが基本部分は既に落ち着き、欧州や米国では各標準化機関による標準化作業も進められている。  (
別紙1「Dublin Core項目一覧」を参照)

3.1 Dublin Coreの特色(従来の図書館目録との違いを中心に)
 従来の図書館目録との違いを念頭においてDublin Coreの特色をあげる。
・著者が作成することを想定
 目録規則が図書館員という専門家による作成を前提としているのに対して、Dublin Coreは情報を作成する著作者が自らメタデータをつけることも想定している。膨大な量のWWW文書などを専門家が集中的に処理することは不可能で、ネットワーク情報資源総体を扱う以上は当然の想定である。
・基本エレメントに限定
 情報専門家でない著作者でも容易に作成できるように、比較的小数の(現在15個)基本エレメントだけを定義している。
・エレメントの意味定義に特化し、構文定義は行わない
 目録規則では記述要素ごとに、「何を記述するか」という意味定義と、「どのような文法で記述するか」という構文定義を行っているが、Dublin Coreでは意味定義のみを行っており、記述文法は規定しない。
 なお、様々なメタデータ規則に適用できる汎用的記述形式としては、XMLをベースとしたRDF(Resource Description Framework)が標準的なものとなりつつある。
・オプション性と拡張性
 目録規則でも記述の精粗は一定程度作成者に委ねられているが、Dublin Coreでは入力必須項目を定めておらず、すべての項目がオプショナルである。また、目録規則が必要な事項すべてを自己完結的に規定しようとするのに対して、Dublin Coreでは基本エレメントのみを規定するかわりに、各機関やコミュニティが必要に応じて追加を行うことを認めている。
3.2 Dublin Coreの制定経緯と今後の見通し
・ワークショップによる検討
 Dublin Coreに関する議論の中心は、1995年から随時開かれているDublin Coreワークショップである。2000年までに8回のワークショップが開催されている。
・基本エレメント15項目の制定
 当初は13項目の基本エレメントが提案されたが、その後15項目に増やされ、1997年の第5回ワークショップ(ヘルシンキ)で確定された。次項のQualifier導入方式との比較で、この15項目をDC Simpleと呼ぶ。
・Qualifierの導入
 さらに詳細な記述を可能にするために、エレメント内にQualifier(限定子)と呼ばれる下位エレメントを規定する動きも進んでいる。Qualifierには、「日付」エレメントに対する「作成日付」「更新日付」等のようにより詳細な意味づけを与えるもの(Element Refinement Qualifierという)と、「主題」エレメントに対する「LCSH」「DDC」等のように値が依拠する体系を示すもの(Encoding Scheme Qualifier)との2種類がある。2000年7月には汎用的なQualifier一覧が承認された。また、地域・分野などで作られるコミュニティが、メタデータの流通性・相互利用性に配慮しながら、独自のQualifierを定めていくことも想定されている。

4. 目録規則の改訂動向5) 6) 7)
 ここ2年ほどの間に、内外の目録規則においてもネットワーク情報資源をにらんだ改訂の動きが相次いだ。Dublin Coreなどのメタデータの動きとは今のところ直接の連動はないが、電子図書館を考えるうえではこちらの動向も無視することができない。以下に、その概略をあげる。

4.1 ISBD(ER)の登場
 1997年にISBD(国際標準書誌記述)の「ER(電子資料)」が制定された。これは従来の「ISBD(CF)」(コンピュータファイル)にネットワーク情報源などの「リモートアクセス」資料への規定を加えて見直し、改題されたものである。

4.2 NCR(日本目録規則)1987年版改訂版の第9章改訂
 2000年8月、NCRの第9章「コンピュータファイル」が「電子資料」として全面的に改訂された。ISBD(ER)も踏まえて、リモートアクセス資料にも適用できる規則となった。

4.3 AACR2(英米目録規則第2版)の改訂動向
 AACR2の第9章(コンピュータファイル)では、既に1988年改訂においてリモートアクセス資料に対処しているが、ISBD(ER)をうけて整合性を考慮した調整作業が進められている。
 さらに、第9章をこえて規則の枠組み全体に及ぶ変更が提起されている。WWW文書のようなネットワーク情報資源は、外形を保ったまま内容が随時更新されてしまうという点で、従来の規則でいう「単行資料」にも「逐次刊行物」にもそのままあてはめ難い。このため、物理的な刊行形態に着目した単行資料と逐次刊行物という2分法から、内容更新の形態に重きをおいた静態(Static)資料と継続(Continuing)資料という枠組みに移行する動きが進められている。

4.4 NACSIS-CATの電子ジャーナルへの対応
 NACSIS-CATでは目録所在データベースにおける電子ジャーナルの取扱いについて「暫定案」(2000.8)を公表している。「図書館でアクセスを保証できる」電子ジャーナルに限った規定であり、IDENT:フィールドを新設してアクセス方法を記述することとなっている。

5. 各機関におけるメタデータ作成の例
 メタデータの作成は既に多くの機関で行なわれている。ここでは国立大学図書館における取組みを中心に概観する。
 なお、紙数の関係から本節では事例の簡単な紹介にとどめるので、詳細は章末の参考文献や当該機関のWWWページを参照されたい。

5.1 サブジェクトゲートウエイのメタデータ
 ネットワーク情報資源に対してメタデータを作成して高品質な情報探索手段を提供するサービスを「サブジェクトゲートウエイ」と呼んでいる。わが国では現在、図書館情報大学(図書館情報学分野)8) 9)、東京工業大学(理工学分野)10) 11)、東京大学(全分野)12)の各図書館で積極的な試みがなされている。
 3機関ではいずれもDublin Coreをベースとしたメタデータ記述となっており、2、3の追加項目やヨミ情報の付加など、若干の拡張が加えられているところもある。

5.2 コレクション・貴重書の電子化に伴うメタデータ
 印刷媒体の所蔵資料をデジタル化したコンテンツの場合には、メタデータは原資料に関わる情報とデジタルデータに関わる情報との2面性を持つことになる。コレクションや貴重書をデジタル提供する際には、まず書誌的情報を表示するのが普通であるが、このようなデータもメタデータである。電子化資料の数が多くなるとメタデータを別途管理して検索させるなどの必要性が出てくる。
 筑波大学13)では、デジタル化資料のメタデータもOPAC上で検索できるように目録データベースへの登録を行ない、通常の図書館目録規則(NCR, AACR2)に従ったメタデータ記述となっている。
 神戸大学16) 17)では、阪神・淡路大震災関連資料を中心とした様々な資料に関するメタデータを独立したデータベースとして構築している。データ構造・記述項目設定とも独自の規則での作成となっている。
 奈良先端科学技術大学院大学14)では、発掘調査された考古遺跡を撮影したスライドを対象に、考古学者と協力してデジタル化を行う「考古学フィルムライブラリー」の構築に取り組んでいる。ここでは、Dublin Coreをベースとして日本考古学に特有のメタ情報を付加したメタデータ作成が行なわれている。

5.3 学内研究成果のメタデータ
 学位論文や紀要論文などの学内研究成果物は、比較的均質な形式を持っておりメタデータが作成しやすいと考えられる。
 奈良先端科学技術大学院大学15)では、米国の学位論文電子図書館NDLTD(Networked Digital Library of Theses and Dissertations)のメタデータを参考にして、学位論文のメタデータ記述を行う計画がある。NDLTDのメタデータはDublin CoreをQualifierの使用により拡張したものである。

6. まとめ −メタデータ標準化の必要性
 図書館で電子化して公開する資料はネットワークにより地理的制約を超えて閲覧することができるので、重複作業を避けて図書館ごとに異なった資料を電子化するのが望ましい。また、ネットワーク情報資源を組織化するサブジェクト・ゲートウエイを構築する場合、1機関ですべてのリソースを扱うことは非現実的なので、地域・分野等によって限定を加えることとなる。以上のことから、電子図書館では自館のコンテンツだけで自己充足できるとは考えられず、必然的に分散協調型とならざるをえない。
 電子図書館の分散協調ネットワークが機能するためには、メタデータの相互利用性が非常に重要である。また、インターネットの世界では図書館がその枠の中だけに閉じこもるのは適当でなく、インターネット情報資源全体での相互利用性も考慮が必要である。十分な相互利用性のためには、メタデータが各館ばらばらではなく、ある程度の標準化がなされていなくてはならない。
 インターネット世界全体での標準化を考えると、Dublin Coreに従うのが最も有効であると思われるが、Dublin Core(現在確定しているDC Simpleの15項目)は著者による作成を念頭においた基本的なエレメントのみの規定であり、情報組織化を専門とする図書館が採用するメタデータとして適当かどうかは議論の余地がある。
 一方、図書館界で新たに電子図書館用のメタデータ規則を作ることも考えられるが、電子図書館で扱われるコンテンツは従来の図書館資料よりもはるかに多様性が大きく、従来の目録規則レベルですべてのコンテンツを包含する規定を作ることは困難である。
 今後は恐らく、単一の規則ですべてを解決するのではなく、対象を特定した精緻な規則や電子化した図書館資料一般に適用する規則、Dublin Coreのようにさらに汎用的な規則など様々なレベルの規則が併用される方向に向かうのではないかと思われる。
 こうした見地からすると、最初から固定的な位置付けをして単一の標準フォーマットを考えるよりも、各図書館がそのコンテンツに応じて必要十分な内容をもったメタデータを独自に作成し、そこから今後国内外で作られていくであろう様々なレベルの標準規則に応じたデータ変換を行って相互利用に対処するという形が望ましいと思われる。ただし、将来にわたるデータ変換を保証するには、各図書館で十分論理的に明快なデータベース設計を心がけなくてはならない。
 このように各図書館でメタデータ作成に努力する一方、同種の資料に取り組んでいる図書館間で相互連携をはかるなど、徐々に記述規則の集約をはかっていく活動も今後進めていく必要があると考える。

<参考文献>
●メタデータ一般、Dublin Core
1)杉本重雄"メタデータについて:Dublin Coreを中心として"『情報の科学と技術』49(1), 1999.1, pp.3-10
2)杉本重雄"メタデータに関する最近の話題から−サブジェクトゲートウエイとDublin Core−"日本図書館協会目録委員会編『電子資料の組織化』(日本図書館協会, 2000.5), pp.45-56
3)杉本重雄"Dublin Coreについて - 最近の動向、特にqualifierについて"『ディジタル図書館』no.18, 2000.9, pp.36-48
4)谷口祥一"情報検索とメタデータ"『人文学と情報処理』no.28, 2000, pp.92-100
●目録規則の改訂動向
5)日本図書館協会目録委員会編『日本目録規則1987年改訂版 第9章 電子資料』(日本図書館協会, 2000.8)
6)永田治樹"目録規則の今後−第25期以降の目録委員会の活動について−"日本図書館協会目録委員会編『電子資料の組織化』(日本図書館協会, 2000.5), pp.6-9
7)古川肇"『英米目録規則』に関する改訂の動向−一つの展望−"『資料組織化研究』no.43, 2000.7, pp.15-29
●各大学の事例
8)平岡博ほか"図書館情報大学ディジタル図書館システム"『情報管理』no.16, 1999.9, pp.471-479
9)平岡博"図書館情報大学ディジタル図書館のメタデータ作成"『ディジタル図書館』no.16, 1999.11, pp.44-49
10)尾城孝一"東京工業大学電子図書館(TDL: Titech Digital Library)"『ディジタル図書館』no.16, 1999.11, pp.24-38
11)尾城孝一"サブジェクトゲートウエイの構築と運営−理工学分野の高品質なインターネットリソースの提供をめざして−"『情報の科学と技術』50(5), 2000.5, pp.280-289
12)栃谷泰之"ゲートウエイ・サービスのためのメタデータ−「インターネット学術情報インデックス」作成の事例報告−"日本図書館協会目録委員会編『電子資料の組織化』(日本図書館協会, 2000.5), pp.57-70
13)石村恵子ほか"筑波大学電子図書館の現状と課題"『大学図書館研究』no.55, 1999.3, pp.65-74
14)新麗"考古学フィルムライブラリー"『NAIST電子図書館レポート2000』2000, pp.24-27
15)今井正和"学位論文のメタデータ"『NAIST電子図書館レポート2000』2000, pp.28-40
16)渡邊隆弘"神戸大学電子図書館システムにおける「電子アーカイブ」の構築"『ディジタル図書館』no.16, 1999.11, pp.3-11
17)渡邊隆弘"震災アーカイブにおけるメタデータの設計"『人文科学とコンピュータシンポジウム論文集』 2000.12, pp.89-96,


目次に戻る