中国語繁体字の標準化にぶつかって

2014年12月13日
posted by 董 福興

今年の10月、私はサンフランシスコで行われるW3C主催のTPACというイベントとブック・イン・ブラウザ会議に参加するため、シリコンバレーに向かった。

太平洋を越えて台湾からアメリカ西海岸へ行くには、とても費用がかかる。数年前、私がまだ取材記者だった頃は、東京、香港、上海、サンフランシスコ、クパチーノなどで行われるIT企業主催のメディアツアーによく招待された。しかしいまや私は、収益の安定しないスタートアップ企業の経営者である。いちばん安い宿と航空券をみつけても10万台湾ドル(日本円で約40万円)の出費となり、自分の事業になんら利益をもたらさないかもしれない旅行にとってはとても痛い。

そこで私は、9月に自分のブログに、この会議に参加しなければならない理由を書いた記事を投稿して資金援助を募り、ペイパルと銀行の口座を用意した。二週間もしないうちに、クラウドファンディングは成功した。

標準化の世界とぶつかる

村田真さんからEPUB 3.0.1についてのメールを受け取ったのは、2013年2月のことだった。彼からの質問は、「台湾の電子書籍リーダーでは”ruby-position: inter-character”に対応がなされているか?」というものだった。

"ruby-position: inter-character"は、台湾でBopomofoと呼ばれているルビを漢字の右側に固定して表示するためのCSS。

私にはその答えがわからず、返事をすることができなかった。台湾でEPUB 3フォーマットへの寄与を仕切っている組織は「資訊工業策進會」(IT産業協会)という、日本の情報処理推進機構(IPA)のような団体だが、その専門家チームはIDPFがEPUB 3.0の仕様にかんする声明を出した後、解散していた。そして当時は、台湾の電子書籍ベンダーでEPUB 3.0をサポートした読書用システムをサポートしているところは一つもなかった。

私はこれについての関連資料を探し、自分で試作品をつくった。それらをあらゆるウェブブラウザとリーダーでテストしてみた結果わかったのは、ウェブ上やEPUBでBopomofo付きの文書を表示させようとしても、まだCSSの仕様が制定されているだけで、ブラウザにもリーダーにも実装されてない、ということだった。この問題はHTMLとCSSに関わっており、IDPFフォーラムでは解決できない。その答えを知りたければ、W3Cに行かなければならないのだ。

考えてもみてほしい。もしBopomofoのルビがウェブ上でも電子書籍上でも表示できないとしたら、どうやってそれらを教材として使えるだろう? 子供たちに北京語を教えるためにBopomofoを使うのは世界中で台湾人だけだ。私たちはこの問題に真正面から向きあわなければならない。私は週一回のテクノロジーコラムを担当している台湾の日刊紙「聯合報」で、この問題を取り上げた記事を書いた。その記事を政府の誰かが読んでくれたことで、物事が動き出したのだった。

お前はだれだ?

出版協会の仲介で、私は文化部(日本の文化庁に相当)の役人と面会することができた。しかし所轄官庁はこの問題を技術的に踏み込んだところまで理解しておらず、ことの重要性もそれらを実施するための術も知らなかったので、不信の念を抱かざるをえなかった。標準化についての経験もなければ博士号ももたない人物が、どうしてこの問題を解決できるだろう?

ちょうどその頃、W3CとIDPFが共同して電子出版に関するコメントを集めるため、ニューヨークと東京、リヨンでワークショップを3回にわたって開催していた。その一つが2013年6月4日に慶応義塾大学で開催された「国際化(i18n)」に対する要望を集めるためのワークショップだった。これは中国語繁体字のルビについての仕様を要請するには絶好の機会だった。出版協会が私をコンサルタントとして雇い、文化部からの助成金を手当してくれたおかげでこのワークショップに参加できた。そして同年の10月に深圳で行われたW3C TPACで、どうしたらBopomofoのルビを実現できるかについて議論がなされたのだった。

中国語組版における多くの未解決問題

その会議の間、私はCSSの仕様をやまほど読み、中国語の組版に解決しなければならない問題が山積していることを知った。中国語繁体字による文章は日本語によく似ているが、漢字だけで記述されており句読点の入れ方も異なるから、日本語組版のルールを全般的に用いることはできない。句読点の文字組み、禁則処理や文字揃えなど、どれも細かなところで違いがある。しかし、なんとかして私たちは解決方法を見つけなければならない。

中国語繁体字の約物は文字の真ん中にふられるため、日本語のように行内調整ができない。活字時代の本は禁則処理なしのほうが多く、欧文と漢字間のアキも四分アキではなかった。(史梅岑『中國印刷發展史』1966, 台灣商務)

W3Cの文書のなかでは「日本語組版処理の要件」(JLREQ)が大いに参考になった。近年、電子書籍の売上が伸びてきたため、要求も高度になっている。これらのルールはすでに「CSS text level4」の段階の仕様書にも書かれていた。しかし、中国語のための仕様をそれに対してその都度求めるのは良策ではない。そこでこの「日本語組版処理の要件」を中国語に翻訳することに決め、なんども読み込みをして、中国語組版に関連する部分をリストアップし、中国語繁体字の組版ルールを加えていった。そうしてできあがったのが「中国語繁体字組版の要件」(TCLREQ)のドラフトである。

このドラフトを書くのはたやすくはなかった。その理由は以下のとおりである。

中国語組版の専門家の不在

JIS X 4051を土台にした「日本語組版処理の要件」はW3Cの公式の参照文書であり、5年にわたって日本語組版の専門家たちが起草したものだ。この文書は中国語・韓国語・日本語(CKJ)のタイポグラフィや組版をウェブの技術がサポートするうえで大きな役割を演じた。ところが台湾や中国本土には、日本語組版においてJIS X 4051が果たしたような役割を担う、組版ルールについての文書が存在しない。この地域では組版の専門家をみつけることもむずかしい。私にできることは、経験豊富な書籍編集者に尋ねたり、活版時代の古い本をみつけたりして、往時の中国語組版の基本ルールの再現を試みることぐらいだった。

中国語組版における日本語や西洋の組版ルールからの影響

活版や写植からDTPへの移行期においては、DTPソフトのようなツールが重要な役割を演じた。しかし実際のところ、これらのツールの組版ロジックは日本語の組版ルールに基づいていた。日本語組版には基準文書があり、出版の市場規模が(当時は)台湾と中国を合わせたりよりも大きかったからだ。台湾の中国語繁体字の組版は日本や西洋のタイポグラフィにかんする思想からすでに影響を受けている。中国語にとってもっともいい方法を見出すのは簡単なことではない。

資金不足

標準化の活動に参加するのは簡単なことではない。先進国においては、グーグル、アドビ、アップル、マイクロソフトといった、その恩恵を受ける営利企業が標準化のために大きな役割を演じている。だが途上国では標準化作業の多くを政府に頼っている。国の年度予算に基づくため不安定となりがりで、予算がカットされたり、あるいはプロジェクト自体が終わってしまった場合、第三者から支援を得る努力をしなければならない。標準化作業が完成するまでには、5年あるいは10年以上の歳月が必要となるが、こうしたスローペースの活動を実際のところ政府は好まない。

先に述べた文化部からの助成金について述べると、台湾の出版協会が80万台湾ドル(日本円で約320万円)を確保してくれたが、そのすべてが活動に利用できたわけではない。ここで得た助成金の大半は渡航費に消えてしまい、残った額はひと月分のサラリー程度。実際に活動するための助けにはならなかった。「中国語繁体字組版の要件」(TCLREQ)のドラフトができあがると、私はW3Cへの加入を申請した。しかしW3Cの最低限の会費でさえ、スタートアップ企業がまかなえる額ではなかった。台湾政府や出版関連団体がなにもしてくれない以上、私にできるのはこのドラフトを自分のパソコンのなかに止め、次の機会を待つことだけだった。

プロジェクトの再起動

北京航空航天大学がW3Cに中国での主催大学(他にはアメリカのMIT、日本の慶応義塾大学、EUのERCIM)として参加したことで流れが変わった。彼らは中国のIT企業が標準化活動に参加するよう、テコ入れに精力的に取り組んでいる。この大学は中国のシリコンバレーといわれる中関村からも少ししか離れていない。TPAC2013で私が「中国語繁体字組版の要件」のプロジェクトについて話をしたところ、彼らもこの活動が継続されること、中国語簡体字のルールになじんだ「中国語組版の要件(CLREQ)」が中国でも成長著しい電子出版産業の標準として刊行できることを願っていた。

この9月に北京で行われた国際化(i18n)ワーキンググループ会議で、私はRichard Ishidaや、電子書籍のベンダー企業数社、そして学者たちとコンタクトをとった。この文書の目的と、そのためには何が必要かを知ってもらいたかったからだ。彼らとの会見後、私はこのプロジェクトのためにW3Cに専門家として招待され、活動を継続することができるようになった。彼らは大いに助けになったが、財政的な援助は得られなかった。

さらに前進

サンタクララで開催されるTPAC2014が一ヶ月後に迫っていた。しかし、私にはこの会議に参加するための方策がなく、お手上げ状態だった。そのとき、アップルでwebkitの開発をしているデヴィッド・ハイアットがwww-styleのメーリングリストにある投稿をした。この投稿によると、”ruby-position: inter-character”のWebkit nightly build(先行テスト版) はすでに基本的に実装されており、それに対するコメントを歓迎しているとのことだった。

“ruby-position”(ルビの位置)のプロパティは、およそ12年前に最初に書かれたHTMLにおけるルビの扱いに関するドラフト以来、実際には実装されていなかった。私は突然、自分がしていることは真に価値があることであり、そして継続しなければならないことだと感じた。そこで、この会議に赴くためのファンドを集める試みを始めることにした。まず、私は台湾のITと出版に関連する団体や組織に向けて、簡単なステートメントを書いて送ってみた。しかし一週間待っても、どこからも返事はこなかった。

そのことで私がとても苛立っていることを知った友人たちが、その手紙を公開してクラウドファンディングでお金を集めたらどうか、という助言をしてくれた。それを聞いて私は迷った。本来これは、政府が手当てすべき問題である。どうやって一般の人々から、そのためのお金を募ったらいいのだろう? 友人の一人で、以前は貓頭鷹出版社で編集長を務めていた陳穎青はこう言った。「これはすでに公的な問題になっている。あなたがやろうとしていることは、人々に利益をもたらすことなのだから、やってみるべきだ」

そこで私は、自分がそのときにしていたことと、これまでやってきたことについてブログに “If you care about Chinese”(もし中国語を大事だと思うのなら)という記事を書いた。さらにこの記事をCSSと電子書籍のオーサリングに関するフェイスブック・グループにも投稿した。人々はこの記事を次々にシェアしてくれた。一人あたりの寄付の額は、1万台湾ドル(約4万円)から200台湾ドル(約800円)までバリエーションをつけた。さらに、これが必要である理由を知ってもらうため、いくつかの講演でも説明した。最終的に41人と一つの団体から総額12万台湾ドル(約48万円)の寄付があつまり、飛行機代と会議への参加費用、宿泊代をまかなうことができた。資金援助をしてくれた人たちの大半は教師と開発者で、電子書籍の事業者や出版社はごく少数だった。

FlyingVのような、台湾で有名なクラウドファンディングのプラットフォームは使いたくなかった。理由の一つは、7%もの手数料をとられてしまうから。もう一つの理由は、必要経費はわずか10万台湾ドルなので、そのようなサービスを使うまでもないと思ったからだ。

TPACの当日、私たちはなんとかして「中国語組版の要件(CLREQ)」のプロジェクトに道筋をつけ、中国語組版にかんするいくつかの細かな問題点を解決できる読書用ブラウザーのベンダーに直接あたろうとした。さらにサンフランシスコで行われた「ブックス・イン・ブラウザー」の会議にも私は参加した。「ツールズ・オブ・チェンジ(TOC)」のカンファレンスは終わってしまったが、「ブックス・イン・ブラウザー」で話し合われる議題は先進的で、興奮させられる。ここで得られる情報は、電子出版の世界を前進させるための命の水のようなものだ。

天は自ら助くる者を助く

簡体字を含めれば、世界では10億人以上が中国語を母国語としている。しかし文化的な複雑さを保存している繁体字のみに限れば、香港と台湾にわずか3000万人がいるのみだ。とはいえ、台湾ではいまだに新刊書の40〜50%が縦書きの本である。この標準化活動に誰も参加しないようであれば、結果的に我々の中国語繁体字は周辺的な存在となるだけだ。これは印刷本だけの話ではない、ウェブであれ電子書籍であれ、私たちの組版ルールは日本語のものに多くを負っている。これは実際、私たちの文化にとってよいことではない。もちろん、日本語組版の要望に対して「ノー」と言えというのではなく、中国語組版の要望を合わせて、基準から実装までもっと早めに進んでほしいのだ。

左から二番目が筆者、右隣りが「CSSの父」と呼ばれるOperaのHåkon Wium Lieさん。左端はVivliostyleの村上真雄さん、
右の二人はBPSの馬場孝夫さんと榊原寛さん。

W3Cの会議とワークショップのなかで、私は日本から来た、NTTやアンテナハウス、ソニー、パナソニックといった企業の人々や、総務省の代表者と会った。中国からも百度(Baidu)、中国聯合通信(China unicom)、ファーウェイ(Huawei)らが参加していた。私は一人でさびしかったが、成し遂げなければならない仕事がある上、前に進まなければならない。もし、このことがなされるべき理由を誰かあなたの知り合いに伝えられるなら、どうか伝えてほしい。支援者がいつか現れ、精神的にも財政的にも支えてくれることだろう。

私自身はウェブテクノロジーの専門家ではないし、いかなるプログラミング言語でもコードを書くことはできない。問題に直面したときは、自分の専門である「編集者」としての技術で切り抜けてきた。ソースを集め、情報を整理し、そこから文脈と解決策を見つけだすのだ。始めたときには自分にこんなことができるという自信はなかったが、小林龍生さんの『ユニコード戦記』(東京電機大学出版局)という本からは大いにインスパイアされた。標準化の世界にぶつかった人間は、少なくとも私一人だけではないのだ。

ときどき、私は自問する。いったい自分は何のために戦っているのか、と。台湾のため? 自分のビジネスのため? 電子出版のため? たぶんどれも違う。私はマルティン・ハイデッガーがヘルダーリンのこんな詩句を引用していたことを思い出す。

「詩人のように、人は住まう(Poetically, man dwells.)」

私たちは自らの言語と、その運び手である文字のなかで快適に暮らしている。私はただ、自分が愛する言語とその文字が正確に、そして美しく、電子機器の画面に表示されてほしいだけだ。中国語を読み書きする人が、私たちの作り上げる環境を享受してくれれば、それで十分なのである。

■関連記事
台・中サービス貿易協定をめぐる台湾出版事情
「エラー451」の時代はやってくるのか?
台湾の電子書籍をEPUB 3で広げる
台湾がOPDSでやろうとしていること
台湾の電子書籍プロジェクト「百年千書」