III.視覚障害者のための読書支援機器・情報検索支援機器の導入について

3.視覚障害者のWWW利用に関する背景

1)大学図書館とWWW

 大学図書館におけるWWWの利用意義は今日ますます大きなものとなってきている。それは、まず情報を提供する側の図書館からみれば、比較的簡単な手段で学内および学外の利用者に対して、必要とあれば各々区別して、情報を提供できること、コンテンツを随時更新することで常に最新の情報を24時間提供できること等が挙げられる。又、今日大学図書館がWWWによって提供できる有用な情報は、OPACによる所蔵目録情報のみにとどまらない。開館日時、入館手続き等を含めた利用案内はもちろん、概要上の統計データ、館報掲載のニュース等から数々のデータベースへのリンク情報およびデータベースそのものに至るまで、まさに大学図書館に求められるあらゆる情報が用意され、蓄積され、利用されうる。又、WWWでは一方的に情報を発信するだけでなく、Webページ内にフォーム等を設けることにより、ページ上でのOPACやデータベース等の検索と結果表示を行うことができるが、その他に、利用者からの文献複写、参考調査、希望図書購入等の諸々の申込みの受付にも、WWWインタフェースによって対応することが可能であり、利用者からの要求や働きかけにも対応する装置として機能する。すなわち、利用者側からみても、単に最新情報を何時でも取得できること以外の大きなメリットがある。

2)障害者のWWW利用

 しかし、このように便利なWWWも現状では作成されるページも、閲覧用ソフトであるブラウザもGUIを前提にしたものがほとんどであり、障害者、とりわけ視覚障害者にとっては、その利用が著しく困難なものになっている。そもそもWWWのページ記述言語であるHTMLは、文章の構造と内容を定義、識別し、利用するための国際標準システムであるSGML(ISO8879)(1986年)のWWW専用のアプリケーションである。SGMLは文書記述標準として、何千という多様な文書型(document type)を記述するための規定をもっており、HTMLは、WWWで使用される特定のタグ形式をもったSGMLの文書型、すなわち見出しや段落、項目の列挙、イラスト等を含んだ一般的な報告書や、マルチメディアやハイパーテキストを提供するとき等に使用できる一つの文書型である。従って元来の目的からいえば、HTMLで記述されたWebページは、文書の構造をタグで明記できるように設計されているため、視覚的にはもちろんのこと、目の不自由な利用者には音声化によって、文書の論理的構造が明快で分かりやすく表現されているはずであった。しかし現実に目を向けると、文書の見出しや章立て等の重要な構造的情報が全く欠落しているか、あるいは、論理的関連や必然性を認めることが難しいような構造とレイアウトをもったページが世界中のWebサイトに氾濫している。又、一般の利用者にとってもデータ量の大きな絵や写真等の画像データ中心のページを閲覧するには特定のブラウザやハードウェアがないと不可能な場合があったり、高速にデータ通信を行なえるネットワーク環境にないと快適にアクセスできないようなページもあるが、もとより視覚的効果のみを狙った、画像を多用した多くのページは、視覚障害者のアクセスを根本的に想定していない性質のものである。障害者によるWWWを利用しての情報アクセスは困難を伴うものがあると言える。

3)障害者のWWW利用を促す法的基盤と提言

 障害者のWWWへのアクセシビリティ向上への要請は、情報処理機器や電子通信機器へのアクセスを容易にするように定められた法律や指針の中にも読み取ることができる。この分野での米国における近年の動きは次のとおりである。

 日本では1990年に通産省の「障害者等情報処理機器アクセシビリティ指針」(1995年見直し)が公表されているが、情報通信へのアクセシビリティに関する全般的なガイドラインについては未整備の状態であることが、郵政省の「高齢者・障害者の情報通信の利活用の推進に関する調査研究会」の報告書の中で指摘されている。(1997年5月)


4.身体障害者のWWW利用に関する最近の研究開発動向

 障害者のWWW利用を支援する技術の研究開発は、最近は世界的に非常に盛んに行われるようになってきている。特に1997年は以下に記すように、世界中の研究者、研究団体からのWWWの標準化組織への障害者のWWW利用に関する活発な研究発表や意見交換による働きかけと、それに呼応するかのようにWWW本拠からの革新的かつ重要な、幾つかのWWWのアクセシビリティに関する仕様の提案が行われ、技術開発の面では非常に充実した内容の1年であった。

1)WWW6 ( 第6回国際WWW会議)

 最新技術の展示や発表が集中して行われるインターネット関連の国際会議の中では今や最も大きなものの一つとなった国際WWW会議は、第1回が1994年にWWW発祥の地スイスのCERNで開かれ、その後米国と欧州とで交互に開催されて、第6回は米国カリフォルニア州のサンタクララでスタンフォード大学等の幹事により1997年4月7日〜11日に開かれた。第6回会議のテーマは「アクセシビリティ」であり、WWW上の情報やサービスにアクセスすることが困難な障害者のニーズに応えようとするような多くの展示や論文提出があった。

  1. 展示、デモンストレーション
  2. 音声によるアクセスに関する論文
     アクセシビリティに関する論文では、"Design of HTML pages to increase their accessibility to users with disabilities"の著者の一人であるウィスコンシン大学Trace R&D CenterのVanderheidenの"Anywhere, Anytime (+Anyone) Access to the Next-Generation WWW"というやや概念的な論文のほかに、音声によるWWWアクセスに関連する次の論文があった。

2)W3C (WWW Consortium)

 WWWが発明されたスイスのCERN (ヨーロッパ素粒子物理学研究所)は、1989年以来WWWに関する研究開発や仕様書の作成なども行ってきたが、元来は原子力研究の機関であり、WWWが世界的に広く利用されるようになるにつれ、本来の業務以外にWWW関係の仕事を行っていくには態勢的に次第に不可能になってきた。又、折りからWWW全般に関する、利害関係において中立的な国際的専門組織の必要性も叫ばれていたこともあり、1994年にMITと共同でW3Cを開設した。その後、CERNはW3Cから撤退し、任務をINRIA (フランス国立情報処理自動化研究所)に譲っている。現在は、MIT、INRIA、慶應義塾大学湘南藤沢キャンパスの三者がW3Cの運営にあたり、WWW技術を推進する非営利組織として、各種仕様の取りまとめ等を行っている。

(1) WAI (Web Accessibility Initiative)

 W3Cが運営する、障害者対応のWWW整備プロジェクトであるWAIは、1997年4月に発足し、第6回国際WWW会議で最初の会合を開いた。WWWの技術開発やガイドライン作成、等のワーキンググループを組織して、W3Cに障害者のWWWアクセシビリティに関する諸々の標準化作業についての働き掛けを行ったり、開発者側に障害者用の新しいアクセス機能を定着させるように促していく等の方針を決めている。米国政府はWAIへの全面的強力を表明しており、障害者雇用促進月間である1997年10月には、NSF (米国科学財団)が今後3年間で約 100万ドルの資金をWAIに援助することを決定した。次項以降に述べるW3CによるWWWのインターフェースに関わる仕様書の策定についても、1997年のWAIによる活動が各々に深く関わっている。

A.WAI Accessibility Guidelines: Page Authoring

 WAIが作成中のアクセシビリティ向上のためのガイドラインには、その対象者によって分けるとページ作成者用、ブラウザ開発者用、およびオーサリングツール開発者用の3つがある。これらの中、ページ作成者用のガイドラインについては、1998年2月に詳細な草案が公表された。基本的には、モニターに送られるキャラクターを音声で読み上げるスクリーンリーダー、HTMLを解釈して読み上げる音声ブラウザ、およびテキストベースのブラウザ等の利用者を想定したアクセシビリティ向上のためのオーサリング方法を定めている。このガイドラインの原型となったものはTrace R&D CenterのVanderheiden等による"Design of HTML pages to increase their accessibility to users with disabilities"であるが、発表された草案は2か月前に提出されたW3CによるHTML4.0勧告を踏まえて、HTML4.0の新しい特徴を所々応用したものとなっている。例えば文書の構造とレイアウトを明確に分離できるスタイルシートにHTMLが対応したこと等である。全体の枠組としては、HTML文書の構造化、キーボード操作によるナビゲーション、代替的形式でのコンテンツの提供、の3つがあり、これらの枠組を前提にしてスタイルシート、画像、等の10項目を挙げ、各項目内でさらにアクセシビリティ向上のために重要な複数の機能を、重要度によって「必須」、「推奨」の2段階に分けて記述している。

(例1)
〔テーブル〕
「必須」テーブルのセルは行と列のラベルに明示的に結び付ける。
「必須」テーブルをテキスト文書の列を揃えるために用いない。
「推奨」文字および数値をテーブルで表現する場合は、同じ情報を線的に表現した代替的ページを用意する。
(例2)
[Accessibility Guidelines: Page Authoring に含まれるチェック・リストから必須項目のみ]
スタイルシート
スタイルシートを使わない場合でもページが利用可能である。
イメージ、クリッカブルマップ
すべてのイメージとクリッカブルマップに代替テキストを付加する。
重要な情報を持ったグラフィックスにはその内容に関する詳しい説明を付加する。
クリッカブルマップはなるべくクライアント側で処理し、クライアント側マップ内のリンクにはすべて内容説明を付加する。
サーバー側にマップを置く場合にはテキストを使ったリンクを別に用意する。
アプレット、スクリプト
すべてのスクリプトに対してスクリプトを利用できないときの代替手段を用意する。
動くテキストや点滅するテキストの動作を止めることができるようにする。
すべてのアプレットに代替テキストを付加する。
重要な情報を持つアプレットには詳しい記述を付加する。
ユーザーから情報を集めるアプレットに対してはFORM要素などを使った代替手段を用意する。
代替手段がないアプレットはアプレットそのものをアクセシブルに作り替える。
音声、ビデオ
すべての音声情報に字訳を付加する。
すべてのビデオ情報に音声による説明を付加する。
すべてのビデオ情報に字訳を付加する。
字訳と音声による説明とは対応する音声やビデオと同期させることができるようにする。
テキスト、記号、句読点、節、段落
HTMLの構造要素は文書の構造を示すためだけに用い、表示方法を指定するために用いない。      
HTMLの表示要素は表示方法を指定するためだけに用い、文書の構造を示すために用いない。  
ヘディング同士は完全な入れ子構造を持つようにし、文書整形のために用いない。
リスト、アウトライン
リストの構造とアイテムは適切なHTML要素でコーディングする。レイアウトの制御にはスタイルシートを用い、マークアップを用いない。
テーブル
テーブルのセルは行と列のラベルに明示的に結びつける。
テーブルをテキスト文書の列をそろえるために用いない。
フレーム
フレーム文書(FRAMESET要素を含む文書)にはフレームを使えないときの記述も付加する。
フレームにはイメージを直接読み込まず、文書の一部として読み込む。
すべてのフレームにタイトルを付ける。
ユーザー入力フォーム
サブミットボタンとしてクリッカブルマップを用いない。
おのおののラベルと対応するコントロールとを明示的に結びつける。
イメージを利用したサブミットボタンには代替テキストを付加する。

(2) アクセシビリティに関わるWWWのインターフェース上の仕様

 A.HTML4.0

 WWWの文書記述言語であるHTMLの最新版であるHTML4.0は、1997年7月に暫定仕様が公開され、同年11月に勧告提案として最終的な校閲を受けた後、翌12月に正式なW3Cの勧告となった。これまでの版に比べて、全面的にアクセシビリティが考慮された内容になっており、障害者のWWW利用時の障碍解決に向けて大きな前進を果たしている。現在のスクリーンリーダー、音声ブラウザ、それにテキストベースのブラウザの利用者が閲覧に障害となるような問題を抱えているページには、構造化されていないページ、逆に構造化のためのHTML要素をレイアウトや視覚的効果のために利用しているページ、画像情報(イラスト、写真、クリッカブルマップ、テーブル、フレーム、動画、等)を代替的テキストなしに多用したページ等がある。こうした障害者にとってアクセスの困難なページの作成を、ページ作成者側が自身の創造性を犠牲にすることなくなおかつページの管理も容易に出来るようにした上で回避することができるようにした。HTML4.0でのアクセシビリティ改善に関する具体的なポイントは次のようなものである。

a.文書の構造化の改善
 文書の構造化の度合いが高ければそれだけアクセスも容易なものとなる。HTML4.0では文書構造を豊かにする数々の要素や属性が追加された。例えば、略語や頭字語を記述するためのABBRおよびACRONYM要素はスタイルシートやlang属性と共に用いられることにより、音声合成時に有効な働きをする。
 次にABBR要素を使った例を示す。
      <ABBR title="World Wide Web">WWW</ABBR>
      <ABBR lang="fr" 
            title="Société Nationale des Chemins de Fer">
         SNCF
      </ABBR>
      <ABBR lang="es" title="Doña">Doña</ABBR>
      <ABBR title="Abbreviation">abbr.</ABBR>

    Q要素は文章内での引用句を示し、従来からあるBLOCKQUOTE要素を補完する。
    Q要素の入れ子の例は、以下のようになる。

     John said, <Q lang="en">I saw Lucy at lunch, she says 
     <Q lang="en">Mary wants you
     to get some ice cream on your way home.</Q> I think I will get
     some at Ben and Jerry's, on Gloucester Road.</Q>

    二つの引用の言語は英語なので、内の引用符はシングル引用符、外の引用符はダブル引用符で表示する。

      John said, "I saw Lucy at lunch, she told me 'Mary wants you
      to get some ice cream on your way home.' I think I will get some
      at Ben and Jerry's, on Gloucester Road."

    また、構造化されたフォームを作るための要素として、FIELDSETやLEGEND要素はフォームコントロ
   ールをグループ化し、フォーム入力時のアクセシビリティを向上させるために役立つ。

     <FORM METHOD=POST ACTION="cgi-bin/xxx.cgi">
     <FIELDSET>
     <LEGEND>個人情報</LEGEND>
     名前:<INPUT TYPE=text NAME=name>
     年齢:<INPUT TYPE=text NAME=age>
     </FIELDSET>
     <FIELDSET>
     <LEGEND>個人環境</LEGEND>
     OS:<INPUT TYPE=text NAME=os>
     ブラウザ:<INPUT TYPE=text NAME=browser>
     </FIELDSET>
     <INPUT TYPE=submit VALUE="OK">
     </FORM>

    同様にOPTGROUP要素はメニューのグループ化を行い、長大な選択肢のリストを眺めずに済むように
   させる。
    次に、テーブルの行と列をグループ分けするための要素として、THEAD、TBODY、TFOOT、COLGROUP
   COLの新しい要素が加えられた。また、scope、headers、axesなどの新しい属性によってテーブルの
   セルにラベルを付けることで、音声ブラウザなどでテーブルを線的に閲覧することが可能となる。例
   えば次の例は、headers属性を用いたテーブルである。

     <TABLE border="1" 
         summary="This table charts the number of cups
                  of coffee consumed by each senator, the type
                  of coffee (decaf or regular), and whether 
                  taken with sugar.">
     <CAPTION>Cups of coffee consumed by each senator</CAPTION>
     <TR>
       <TH id="t1">Name</TH>
        <TH id="t2">Cups</TH>
         <TH id="t3" abbr="Type">Type of Coffee</TH>
         <TH id="t4">Sugar?</TH>
       <TR>
         <TD headers="t1">T. Sexton</TD>
         <TD headers="t2">10</TD>
         <TD headers="t3">Espresso</TD>
         <TD headers="t4">No</TD>
        <TR>
         <TD headers="t1">J. Dinnen</TD>
         <TD headers="t2">5</TD>
         <TD headers="t3">Decaf</TD>
         <TD headers="t4">Yes</TD>
        </TABLE>

    上の例は音声ブラウザによって次のように出力されうる。

     Caption: Cups of coffee consumed by each senator
     Summary: This table charts the number of cups
              of coffee consumed by each senator, the type 
              of coffee (decaf or regular), and whether
              taken with sugar.
     Name: T. Sexton,   Cups: 10,   Type: Espresso,   Sugar: No
     Name: J. Dinnen,   Cups: 5,    Type: Decaf,      Sugar: Yes
    上の例ではabbr属性の効果的な使用もされている。
b.スタイルシート
 元来HTMLはプロフェッショナルな出版を行うために設計されたものではなかった。従って、見映えや体裁などの表現上の要素についてはHTMLはコンテンツ作成者の要求を常に満たすものではない。このようなレイアウト上の制限を克服するためにW3CはあえてHTML4.0自体に表現(presentation)に関する新規のマークアップや要素の追加を行うことはせず、CSSのようなスタイルシートにレイアウトや表現上の機能を受け持たせるという方針をとった。
 文書の構造(structure)と表現(presentation)をはっきりと分離させることで、文書は管理がしやすくなり、また異なる形式での再利用にも柔軟性をもった対応が可能となる。同じ一つの構造をもったHTML文書に、その構造的な内容には殆ど手を加えることなしに、異なる種類のスタイルシートを適用させることによって、多様な利用者層や媒体に対して各々見合った形で文書の体裁をデザインすることができる。例えば、色彩感覚に障害のある利用者に対して、弱視の利用者に対して、また点字ブラウザ、音声ブラウザ、携帯端末、等の利用者に対して、各々に相応しい表現上の出力をスタイルシートによって付与することができる。(このことは見方を変えると、ある特定のスタイルシートが一つあれば、大量のHTML文書の書式を一括して管理できるということでもある。)
 スタイルシートがアクセシビリティの面で果たす役割はこれにとどまらない。より重要なのは、本来は構造的な表現を目的としたHTMLのマークアップを視覚的効果を狙うために故意に用いるという誤った使い方に頼らずに済むという点である。こうした用法を誤ったHTMLのマークアップは多くのページへの正常なアクセスを困難なものにしているのである。
 例えば、HTMLはパラグラフ全体を字下げするような要素や属性をもっていない。そのため、多くのページ作成者は、本来は文書の引用部分を示す要素であるBLOCKQUOTEを、実際にそこに引用がない場合でもあえて用いることによって字下げを行うという方法をとりがちである。BLOCKQUOTEによる引用部分はGUIによるブラウザではスクリーン上で自動的に字下げが行われて表示されるからである。しかしこの方法では視覚障害者が音声ブラウザを用いてアクセスしたときに問題が生じる。音声ブラウザはその部分をあくまでHTML文法に基づいて引用部分であると解釈し、利用者に引用が行われているように知らせる。これ以外にも文書の論理的構造に関する情報を示す要素を視覚的表現のためのマークアップとして誤用する例は現在多く見られる。例えば、テーブルや透明画像をレイアウトの目的で使用したり、H1やH2等の見出し用のタグを、それが実際に見出しではなくとも、字の大きさを変えるだけのために用いたり、文章の強調箇所を示すEM要素を、GUIによるブラウザではその部分が斜体字として表現されるため、単に字体を変える時に用いたりする等である。こうしたHTMLタグの誤った流用は、スクリーンリーダーや音声ブラウザの利用者による文書の論理的構造の把握を著しく阻害し、利用者への文書内容の正確な伝達を困難なものにする。しかし、スタイルシートを使えば修飾やレイアウト上の表現をもっと豊かにすることができるし、同時にHTMLの誤用に起因するアクセシビリティの深刻な問題を最小限に抑えることができる。スタイル・シートによって、HTMLマーク付けは簡潔になりページ作成者は体裁への配慮からおおいに解放される。
 スタイル情報は各要素や要素のグループに設定することができる。スタイル情報はHTML文書内や外部スタイルシートで設定する。
 次の例は、HTML文書内でブロック全体の字下げを指定している。これでBLOCKQUOTEを字下げのために流用することは避けられる。
       あああああ
       <BR><SPAN STYLE="margin-left:30px; display:inline"> 
       いいいいい
       <BR></SPAN><BR> 
       ううううう
         ↓
       あああああ
         いいいいい
       ううううう
 外部スタイルシートを用いる場合、LINK要素で文書を外部スタイルシートにリンクさせ、type属性でスタイルシート言語を特定し、media属性で再現しようとしている媒体やメディアを特定する。ブラウザは、現在の装置に適したスタイルシートだけをネットワークから読み込むことができる。次の例は、音声ブラウザ、GUIブラウザ、印刷用の各々について適切なスタイルシートを指定している。
        <LINK rel="stylesheet" media="aural" href="corporate-aural.css" type="text/css">
        <LINK rel="stylesheet" media="screen" href="corporate-screen.css" type="text/css">
        <LINK rel="stylesheet" media="print" href="corporate-print.css" type="text/css">
 以前の版であるHTML3.2では、配列・文字サイズ・テキストの色を調整する要素や属性を提供していた。しかし、スタイル・シートはより強力な体裁調整機構を提供できるため、W3CはHTMLの体裁調整用の要素・属性の多くをいずれ廃止していく方向である。HTML4.0の仕様書ではこれらの要素や属性に「不適切」(deprecated)というマークを付け、別の要素やスタイルシートで同じ効果を出す例を並記している。こうしてページの見映えに関する記述をHTMLの記述体系から追い出してスタイルシートにそれを受け持たせ、HTMLではページの論理的構造のみを記述するようにしていくことで、障害者のWeb利用も格段にしやすくなる。HTML4.0で正式にスタイルシートに対応したことはWebのアクセシビリティ向上の面で非常に大きな意味をもっている。
c.代替的コンテンツ
 画像情報はスクリーンリーダー、音声ブラウザ、文字ベースのブラウザ等の利用者に対して文字情報でも提供されないと閲覧不能である。ページ作成者は、画像、映像、音声、スクリプト、アプレット等の文字以外のコンテンツを文字情報や文字による説明で補完することを常に意識する必要がある。HTML4.0では、代替的コンテンツや代替的形式による説明に関する幾つかの新しい勧告を行っている。
 例えば、IMGやAREA要素に対してはalt属性を用いて文字による記述を義務付けた。
 又、新しい属性として、画像情報の短い説明を行うtitle、外部文書によって画像情報の長大な説明を行うlongdesc等がある。
     <BODY>
       <P>
       <IMG src="sitemap.gif"
            alt="HP Labs Site Map"
            longdesc="sitemap.html">
       </BODY>
 又、テーブルについては、CAPTION要素でテーブルの目的の短い説明を行い、summary属性でテーブルの目的や構成の要約などの長い説明を行う。これは音声ブラウザや点字ブラウザの利用者にとって大変有用である。
     <TABLE summary="This table charts the number of cups
                         of coffee consumed by each senator, the type 
                         of coffee (decaf or regular), and whether
                         taken with sugar.">
      <CAPTION>Cups of coffee consumed by each senator</CAPTION>
      <TR> ...A header row...
      <TR> ...First row of data...
      <TR> ...Second row of data...
      ...the rest of the table...
      </TABLE>
 又、フレームに対応しないブラウザのためにコンテンツを指定するNOFRAME要素、スクリプトに対応しないブラウザのためのNOSCRIPT要素がある。
     <SCRIPT type="text/tcl">
        ...some Tcl script to insert data...
       </SCRIPT>
       <NOSCRIPT>
        <P>Access the <A href="http://someplace.com/data">data.</A>
       </NOSCRIPT>
 上の例ではスクリプトに対応していないブラウザでもリンク先から同じデータを受け取ることができるようにしている。
 代替的コンテンツの提供手段としてHTML4.0の新しい要素の中でも最も重要なものの一つがOBJECTである。OBJECT要素はOBJECTが指定したデータをブラウザが出力できない時、OBJECTが更にマークアップしたコンテンツを出力する。OBJECT要素が最もその効力を発揮するのは、クライアントサイドクリッカブルマップ(クライアントサイドイメージマップ)に応用したときである。次に挙げる例では、OBJECTが入れ子構造をとっていて、ブラウザがpng画像に対応していない場合はgif画像を、gif画像にも対応していない場合、例えば音声ブラウザのような場合はクライアントサイドイメージマップでなおかつ文字ベースでアクセスできるようになっている。
      <OBJECT data="navbar.png" type="image/png" usemap="#map1">
         <OBJECT data="navbar.gif" type="image/gif" usemap="#map1">
            <MAP name="map1">
            <P>Navigate the site:
             <A href="guide.html" shape="rect" coords="0,0,118,28">Access Guide</a> |
             <A href="shortcut.html" shape="rect" coords="118,0,184,28">Go</A> |
             <A href="search.html" shape="circle" coords="184,200,60">Search</A> |
             <A href="top10.html" shape="poly" coords="276,0,373,28,50,50,276,0">Top Ten</A>
            </MAP>
         </OBJECT>
       </OBJECT>
 こうしてページ作成者は同じ場所に様々なブラウザに対応した何通りものクリッカブルマップを用意することが可能となる。
d.容易なナビゲーション
 視覚障害者のWeb利用を最も困難にしているものの一つは、Webページを行き来する際の操作が、リンクテキスト、入力フォーム、クリッカブルマップ等いずれのターゲットの場合も2次元的な座標軸上での位置関係を視覚的に判断しないでは行うことが難しいという点である。こうした操作をキーボードで行なえるように、HTML4.0はキーボードショートカットを定義できる属性を導入した。
 accesskey属性はフォーム入力制御やリンク先移動を特定のキーに設定する。
      <A accesskey="C" 
             rel="contents"
             href="http://someplace.com/specification/contents.html">
           Table of Contents</A>
 実際にはALTキーやCMDキー等との併用によってaccesskeyで設定されたキー入力が有効となる。上の例ではCを押すことでアンカーで指定された文書にアクセスできる。tabindex属性は文書構造の論理的連関によるページ内でのリンク移動やフォーム入力をキーボードで行うことができるようにする。
 次の例では、先ずボタン、そしてフォーム入力の順にナビゲーションが行われ、最後にアンカーで指定したサイトにリンクする。
      <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0//EN"
          "http://www.w3.org/TR/REC-html40/strict.dtd">
       <HTML>
       <HEAD>
       <TITLE>A document with FORM</TITLE>
       </HEAD>
       <BODY>
       ...some text...
       <P>Go to the 
       <A tabindex="10" href="http://www.w3.org/">W3C Web site.</A>
       ...some more...
       <BUTTON type="button" name="get-database"
                  tabindex="1" onclick="get-database">
       Get the current database.
       </BUTTON>
       ...some more...
       <FORM action="..." method="post">
       <P>
       <INPUT tabindex="1" type="text" name="field1">
       <INPUT tabindex="2" type="text" name="field2">
       <INPUT tabindex="3" type="submit" name="submit">
       </P>
       </FORM>
       </BODY>
       </HTML>
 B.CSS2 (Cascading Style Sheets 2)

 CSS開発の作業は1994年にCERNで開始され、1996年12月にW3Cはスタイルシートの標準的仕様としてCSS1を勧告した。その後幾つかの機能を拡張して1997年11月にW3CはCSS2の最初の草案を発表した。CSS2ではCSS1に比べて視覚的表現に関しては表示位置指定の表現力が印刷時を含めて強化されるなどレイアウトの調整に改良が施されており、定義されたフォントがローカル側に存在しない場合はネットワーク上の指定された場所からフォントをダウンロードしてきて使用する機能も追加された。また、アクセシビリティに関する機能については、聴覚的な表現上のスタイルをHTML文書に対して外側から定義できるAural style sheetsの機能を盛り込んでいる。これはT.V. Ramanが発表したCascading Speech Style Sheetsを全面的にベースにしているが、スタイルシートの概念としてはRamanと同様にCSS1の特徴である、上位要素から下位要素へのスタイル属性の継承(cascade)が行われるという点を引き継いでいる。又、スタイル定義等の構文もCSS1にならっている。
 一般に、スクリーンリーダーを使用してWebページを閲覧する場合、スクリーン上のテキストの修飾やスタイル等の表現までは利用者に伝えることが出来ない。仮にページの文書構造が本来のままの形で伝えられたとしても、表現的な効果はGUIによるブラウザを通して閲覧する場合に比べると小さくならざるをえない。しかし、構造化された文書そのもの(HTML)と視覚的効果(スタイルシート)とを分離することで、他の媒体の表現上の効果をも別のスタイルシートを作成することによって、文書本体に与えることが可能となった。聴覚的表現のためのスタイルシートは視覚的表現用のスタイルシートと一緒に用いることもでき、又、他のメディア上の表現についてのスタイルシートについても同様である。CSS2のAural Style Sheetsで定義されているのは、音量、会話、一時休止、音源の空間的配置等の一連の属性(properties)である。これらを用いることで、例えば見出しの部分を音量を上げてゆっくり発声させる、引用部分の声色を変化させる、等といったような表現上の効果を付与することができ、ページ閲覧時の内容の把握もよりしやすくなり、アクセシビリティの向上につながる。
 次の例は、見出しの各々の前後に置く一時休止時間の設定である。

         H1 { pause: 20ms } /* pause-before: 20ms; pause-after: 20ms */
         H2 { pause: 30ms 40ms } /* pause-before: 30ms; pause-after: 40ms */
         H3 { pause-after: 10ms } /* pause-before: ?; pause-after: 10ms */
 C.SMIL (Synchronized Multimedia Integration Language)

 1997年11月、W3CはWeb用のマルチメディアコンテンツの簡易な作成の実現を目指した新しい言語であるSMILの最初の草案を発表した。SMILはWWWにTV番組のようなコンテンツを組み込むことができるが、ネットワークの帯域幅が対処できないほどのデータ量の伝送を必要とせず、ページ作成もごく少ない簡単なタグを使って、単純なメディア・オブジェクトを、オーディオ、画像、テキスト、ストリーミング・オーディオ/ビデオなど様々なフォーマットに編成できるようになるという。SMILではHTMLのリンク機能に加え、時間軸に沿ったメディア制御ができるようになる。各メディアの同期のほか、音声トラックでの言語の選択や、回線に合わせて音声やビデオのバージョンを選ぶ機能などが提供される。
 又、SMILは単純な記述言語で,文章とそれを読み上げる音声のような複数の要素が同調したページを、難解なスクリプトなしに制作することが可能である。たとえば,SMILによってWeb制作者は音声ファイルAを再生,並行して動画ファイルBを再生したり、音声ファイルAの再生が終了したら画像Cを表示したりするようなことが可能になる。
 SMILはSGMLをベースとしたメタ言語であるXML (Extensible Markup Language) に基づいており、SMILはXMLの構文規則に従う。例えば文書の時間的進行を司るためには、parallelやsequentialタグで記述する。一連の画像および音声を同期させてスライドショーをつくるためには、複数枚の画像と音声をparallelタグで括ればいい。これまでと同様にシンプルなテキストエディタでWebページを制作できるということがSMILを使いやすいものにとどめる特徴になっている。次のSMILは、6秒後に音声をスタートさせ、その4秒後に画像を並行して表示させるというparallelタグの記述例である。

    <par>
      <audio id="a" begin="6s" ... />
      <img  begin="id(a)(4s)" ... />
    </par>
          par
    |-----------------|
       6s      a
    <---->|-----------|
         4s
           <-->
                img
              |-------|

 SMILでは一つの情報の異なるメディアによる表現を同時にしかも同期をとって利用者に届けることが可能なため、視覚障害者だけでなく聴覚障害者のWeb利用にも有効であり、WAIによるガイドラインAccessibility Guidelines: Page Authoringでもビデオと音声の同期に関する項目において言及している。

3)その他の注目すべき研究開発

(1) DAISY Consortium/RFB&D/Productivity Works

 DAISY (Digital Audio Information System)と呼ばれる音声データの組織方法に基づいた、新しい録音図書の仕様は1993年にスウェーデンの国立録音点字図書館で開発されてから、国際共同開発組織であるDAISY Consortium等の活動によって従来のカセットテープによる録音図書に代わる新しい録音図書の国際的標準として次第に成長してきている。DAISYのファイル形式であるDTB形式は音声のフレーズレベルまでの索引付けを行うことによって、目次や索引により図書全体の中の目的の部分やページを瞬時に呼び出すことができる。1997年8月にデンマークのコペンハーゲンで行われたIFLA盲人図書館専門家会議のテーマは「代替的形式による資料をもつ仮想図書館へ向けての障碍の克服」であり、電子的資料あるいは資料の電子化に関する多くの発表が行われたが、DAISYに関する数々の発表や展示も大きな部分を占めていた。また、その1か月後にアメリカのワシントンで開かれたNISOの標準化会議でも新世代の録音図書は電子図書館の発展と決して無縁ではないことが確認された。このDAISY形式によるデジタル録音図書の技術とWWWのHTMLやマルチメディアに関する仕様とに非常に重要な関連性を見い出したRFB &D (Recording for the Blind and Dyslexic) とDAISYは新しい録音図書の技術もWWWをベースにして開発していくことが重要であるとの認識に達した。この2つのグループに、pwWebSpeakという音声ブラウザの開発元であるアメリカのProductivity Works社が加わり、W3Cで開発中のマルチメディア言語(SMIL)に対応するようなWWWでのデジタル録音図書技術の研究開発を1997年の7〜8月から開始した。その過程でRFB&DとProductivity WorksはW3Cのマルチメディア言語のワーキンググループに加わり、主にデジタル音声技術と音声とテキストとの同期処理技術についてW3Cに働きかけを行っている。DAISY形式の仕様もそしてSMIL言語自体もこれからの発展や成長が予測されるが、WWWのアクセシビリティに密接に関わって進展していくことは間違いないと思われる。

(2) T.V. Raman

 複雑な数式を含んだLaTeX文書を音声で読み上げるシステムAsTeRの発明等、音声化の分野でのパイオニアとされるAdobe社の研究員T.V. RamanはUNIXのエディタであるEmacs上で走らせるプログラムを音声化するシステムEmacspeakを開発した。Emacsはエディタであると同時にほとんどシステムのシェルや「環境」に近い使用が可能であり、しかも全ての操作をキーボードのみで行なえる。この上で動くプログラムの入出力を音声化するようにしたシステムがEmacspeakで、専用のWebブラウザを用いることでページの文書構造を解析してそれを特別な音や声で区別して分かりやすい音声に(例えば、見出しはバリトン、脚注はソプラノというように)変換することができる。従来のスクリーンリーダーが画面上の文字情報を読み上げるのにとどまるのに対し、HTMLを解釈して文書の論理構造をもとに音声化する音声ブラウザとしてもっとも優れたものの一つとして定評がある。また、RamanはWebページの聴覚的表現に関するスタイルシートであるAural Cascading Style Sheets (Cascading Speech Style Sheets)を提唱し、W3CのCSS2にその機能が取り込まれる等、WWWのアクセシビリティ向上に果たした役割は非常に大きいと言える。

(3) 千葉大学工学部市川研究室

 日本での注目を浴びている研究として、千葉大学工学部情報工学科の市川研究室で行われている「表および数式の音声化の検討」と「視覚障害者用WWWブラウザのUI設計」がある。特に後者についていえば、ナビゲーション操作からメニューの選択、文字の入力まで一連の操作を全て一貫したインタフェースによりアクセスでき、テンキーによる論理的アクセスを行い、ページ情報を文章構造に分解して音声でアナウンスできる。この設計に基づいたブラウザの日立製作所との共同開発による試作品が1997年11月のCOM Japan97で展示公開され、非常に大きな関心を呼んでいる。


III-1,2へ  目次へ  附録1へ