延命寺 寺とパソコン~番外編~
(5) パソコンと漢字の諸問題
はじめに
パソコンと漢字の議論がしばしば「イスの投げ合い」(坂村健)になるのは文化論も政治論も技術論もごちゃまぜにして論議するからである。
漢字はいるか
そもそも日本語の表記に漢字は必要かというあたりから湯飲みの投げ合いが始まる。もっと漢字を教えようという意見から漢字は少ないほうがいい、あるいは全廃して仮名やローマ字で表記するほうがよいという意見まで、いつまで論じても一致点が見つからない。
私は意味を持つ言葉は漢字で書き、言葉同士の関係は仮名で書くという漢字仮名交じりという表記は合理的だと考えている。(固有)名詞は大文字で書き始めるというようなものである。
パソコンと漢字
パソコンでどの漢字を扱うべきかという議論にはいると灰皿が飛び交う。現代一般に使用する漢字で十分だという意見から、古典や漢文で扱う文字、果ては少数民族の言語まで扱うべきだという意見まで、これも終りがない。
仏教徒の立場からはせめて般若心経が書けなくては使い物にならないし、若者にとってはあるタレントの名字が書けないのなら役に立たない。ローマ字論者にとっては長音記号が使えないのならパソコンなんて要らない。
漢字とパソコン
パソコンで漢字を扱う技術論に入ると案外冷静な議論が始まる。これはどの方法でやっても百万字以上の文字が扱えるようになったからである。よほど高性能のパソコンでなくては多くの文字を扱うなどということは不可能ではないかというような意見は、「超漢字」が今では中古パソコン店でも見つからない386マシンで動作したという報告からも意味
がなくなった。
文字という貿易障壁
コンピューターで英語のアルファベットを使うのにそれほど難しい問題はない。ドイツ語やフランス語も扱うとなると少し難しくなる。漢字を扱うのはかなり難しかった。ここで政治論のわき道による。
「漢字が最大の貿易障壁だ。」という暴論は論外としても、パソコンでの文字処理についてはしばしばアメリカが異議申し立てをする。スペイン語では「ll」は「l」が二つではなく一つの文字なのだが、スペインでは「ll」というキーを持たないものの販売は推奨されなかった。これは貿易障壁だという抗議をするのがアメリカである。そしてアメリカが求めるのは「機会の平等」ではなく「結果の平等」であることも留意する必要がある。
平等にチャンスが与えられることではなく、結果的にアメリカ製品がある程度の割合を占めることを求めるのである。
切り替えか並べ換えか
さて、パソコンで文字を扱うときの問題の解決には二つの大きな流れがある。
一つは「切り替える」やり方。言語や文字が変わるときに切り替える命令(正確にはエスケープシーケンスコード)を入れて、ここからフランス語、ここから漢字、ここから・
・・というやり方(正確には文字コードを切り替える)。この方法の利点はほぼ無限大の文字が使える点。仮に「あ」に「濁点」を付けるような「まんが文字コード」なるものを作れば「ここからまんが文字」という切り替え命令を入れて利用することが出来る。欠点は何かの事情で切り替え命令が伝わらなかったときに、今どの文字コードを使っているのかコンピューターに分からなくなること(実際にはそういう場合のエラーを防ぐ仕組みがある)。
学術的に使われているのはISO-2022という方式。ただし、切り替える文字コード自体の内容(文字集合)にどの文字を入れるかという議論は残る。ここで「パソコンと漢字」という項目まで戻ってしまう(当然「まんが文字コード」などというものが認められるとは思えない)。
市販ソフトでパソコンで扱う文字に制限を付けないのが、「今昔文字鏡」と「トロン文字コード」。これらは典拠と必要性が認められれば「まんが文字コード」が採用される可能性がある(「超漢字」は漢字以外はユニコードを採用している)。
もう一つは「並べ換える」やり方。文字に使える領域に文字を重ならないように当てはめるやり方。この方法の利点は文字コードの切り替え命令が要らないから設計が簡単にできること。欠点は空き領域が無くなれば文字の追加が出来ない点。多くのパソコンで使われているシフトJISコードというのはこちらの方法をとっていたので第二水準までの文字にないものを利用するには大きな苦労を強いられたのだ。しかも空き領域に独自の文字割当をした会社が出てしまった(「機種依存文字」)ので、そのパソコン独自の文字を利用した文書は他のパソコンでは別の文字が出たりすることになる。
そして最近普及し始めたユニコードもこちらのやり方である。文字領域が限られているので日中韓の字体が異なる漢字にも同じ文字番号を付けた(中日韓統合漢字)。もう行き詰まることが見えている。そこでこれに切り替え情報を付け加えて(実際にはもう少し複雑な処理をする)今の規格の何倍もの文字を使えるようにした。こちらでは「拡張中日韓統
合漢字」も使える。ただし、この「拡張中日韓統合漢字」はまだどのパソコンソフトが採用するか明らかではない。
ユニコードの問題点
ユニコードの問題点は「貿易障壁」などという政治問題を除けば文化論と技術論に絞られる。文化論といっても文化侵略とかアメリカ主導ということではなく「統合漢字」(ホネは右か左か)の問題である。日本語だけで使う場合は使える漢字が今より増えるからある点便利になるが、日本語と中国語の混ざった文章を書くためには両方の漢字フォントが必要になる。
「起源が同じで字形が似ている漢字に同じ文字番号を振っても構わない」と思う人はギリシャ文字やキリル文字でローマ字と同じ字形の文字(例えばA、B、Tなど)には別の文字番号を付けずにアスキーと統合せよと主張してもらいたい。漢字の字形の問題はそれぞれの国に任せるべきである。
技術的には互換性のなさが問題になる。パソコンではシフトJISを使い、電子メールではJISを使っていて問題が出ないのはシフトJISはJISをずらした(シフトした)だけだから
メールソフトが自動的に変換できるためである。ユニコードはシフトJISからもJISからも計算で求めることが出来ない。しかも現在の文字表では漢字の字体に誤りがあるのでは「両方のいいところを」などとのんきなことは言えない。
JISの失敗
ユニコードが羽振りを利かすようになったのは、アメリカのメーカーの戦略やその使い走りをした人々の暗躍のほかにJISの失敗もある。
そもそもJISというのは工業規格なのだが、パソコンで漢字を扱ううえでいくつか過ちを犯した。78JISと83JIS(私はこう略すのがいいと思う)で文字番号の入れ替えや字体の変更(モリオウガイ問題)をしたことがいまだに尾を引いている。90年に印刷上の必要から(と私は理解している)補助漢字が定められ、これを利用すれば般若心経もあのタレントの名字も(北欧などで使われる特殊ローマ字も)書くことが出来るが、ユニコードに採用されるまではマックでもウィンドウズでも書き表すことが出来なかった(外字を作るしかなかった)。
実はトロンなどは最初からサポートしているし、補助漢字の分かる辞書も五つ以上市販されている。
しかし補助漢字の制定基準があいまいだったということで2000JIS(JIS第三水準・第四水準)が制定された。基準をはっきりさせたことやアイヌ語仮名の文字コードを決めたことなどは功績だが、シフトJISとの共存が出来るように実装したので、特定機種で使っている文字番号と重なる部分が出てきた。78JISと83JISの問題に加えて、2000JISと機種依存文字との混乱が始まるかもしれない。私は2000JISは今では誰も話題にしない新JISキーボードと同じ道をたどるのではないかと思っている。
技術的には可能だが
おおまかにはこういうことだが、字体の問題でまた混乱が始まる。代表の文字だけに文字コード(文字番号)を付けて異体字はフォント(文字の形)をきり替えて対処すればいいという意見、異体字にも文字番号を付けるという考え方(「超漢字」はこちらの立場)、代表の文字だけに番号を付けて異体字には子番号を付ければよいという立場。「ワタナベ」の「ベ」、「ヨシダ」の「ヨシ」の書き分けは技術的にはどの方法でも可能である。どれが簡単で分かりやすいかというだけの違いである(誰も主張しないが印刷技術的にはローマ字の大文字と小文字に同じ番号を付けてフォント切替えで処理することも可能である)。
日本語の縦書きと横書きでは文字の形を替えたほうが読みやすくなるが、縦書き用と横書き用で文字コードを変えるか変えないかという議論も出てくる。
そして振り出しに
技術的にはどの方法でも多数の文字を処理することが出来る。だからここで問題はそもそも漢字が必要かという振り出しに・・まで戻らなくても、パソコンにはどの程度の漢字が必要かという項目へまた戻ってしまう。
パソコン利用者としては
しかしパソコン利用者としてはどうするかという結論は簡単である。文字コード論議がどうであれ、必要なものを使えばいいのである。使い分けが現実的な解決策である。情報
交換にはJISしか使用しないという逆説のもとで。
私はマックとウィンドウズとトロンの三つは必要だと言っている。どれか一つで必要な漢字処理のすべてをすることは出来ない。マックでは今年の夏に出る製品から「日本語で一万七千もの文字が利用できる」などと世間知らずの自慢をしている。しかし多言語の並立は今でも簡単である。ウィンドウズではDOS時代の資料との互換性が保てなくなる。そのかわり無理やり二カ国語を共存させるソフトは多い。トロンの「超漢字」では縦書きは表示しか出来ない。ただ使える文字の多さは半端ではない。
そしてJISは情報交換用漢字符号を制定しているのに機種が違っても情報交換できるのはまだJIS第二水準までである。外国との情報交換にはローマ字が安全である(正確には7ビットコード)。インターネットのどこかでまだ使われている7ビットコードしか理解できないコンピューターを経由する恐れが有る限りは。
実務には
そして実務には私のこの分かりにくい文章を読み返すより、涌井良幸・涌井貞美共著『 困ったときのパソコン文字解決字典』(誠文堂新光社)を読んでもらったほうが良い。文字コードの位置づけにいくつか異議があるが、実務には役に立つだろう。
佐久間光昭
(4) パソコンを仏教に使うために |