台湾の電子書籍をEPUB 3で広げる

2012年11月28日
posted by 董 福興

posted by 董福興(WANDERER Digital Publishing

このたび『Gene Mapper』という小説の中国語繁体字版(『基因設計師』)のEPUBファイルの制作を担当し、ワンダラー(WANDERER Digital Publishing)という会社を起業したばかりの董です。『Gene Mapper』は、著者の藤井太洋さんが一人で電子出版し、販売しています。この作品をすでに数千人もの人が読んだことで、日本にもようやく電子出版の元年が来た、という実感があります。

中国語繁体字版『基因設計師』をKinde Paperwhiteで表示したところ。

電子出版の「元年」は実際にいつやってくるかということへの私自身の考えは、以下のとおりです。

  1. 電子書籍が本のように読みやすいこと
  2. 読みたい本が電子書籍として存在すること
  3. 電子書籍が手に入りやすく、その状態が永続すること

この三点が満たされれば、元年がいつだったかは、そんなに重要なことではありません。日本はこの方向に進んでいます。しかし中国語繁体字による台湾の電子書籍がこの三点を満たすまでには、まだ何年かが必要と思います。

中国語繁体字の「電子出版元年」

ここで、台湾の電子出版の歴史について少し書いてみたいと思います。中国語繁体字とコンピューターの歴史は、あるインプットメゾット(IME)ができたことから始まります。1976年、「中国語コンピューターの父」といわれる朱邦復さんが「倉頡輸入法」というIMEを発明しました。いまのPinyinやBopomofoなどのように、読み方から入力するものではなく、漢字の形を分けて、入力するものです。1982年に、彼はこのIMEの特許権を放棄しました。中国語繁体字とコンピューターは、それからどんどん繋がっていきました。

中国語繁体字対応のキーボード。「中」、「大」、「人」、「心」などは、倉頡輸入法に対応するため。

朱邦復さんは2000年頃に、台湾のコンピューター会社と連携し、台湾初の電子書籍リーダーを作りました(下の写真を参照)。これは2001年に発売された「文昌一號」で、日本における∑ブック、LIBRIeに相当するものです。

当時、出版社の人は彼にこんな苦情をいったそうです。

「そんなものを作ったら、誰も紙の本を買ってくれなくなる。私たちは倒産しちゃうぞ!」

しかし、当時は技術が未熟でしたので、電子書籍のリーダーもコンテンツも、全然広がっていきませんでした。その間、電子辞書のほうは発展していったにもかかわらず、電子書籍はブームになれなかったのです。

その後、KindleやiPadの普及とともに、台湾でも電子書籍関係の販売サイトはどんどん増えています。けれども技術者たちは出版のことを全然わかっておらず、できあがった電子書籍は全然「本らしく」ありません。

台湾は当初、EPUB 2を共通フォーマットとして採用しましたが、これは縦書きもできず、禁則処理もできませんでした。技術者には、なぜ出版者がその組版ではダメだというのかがまったくわかっておらず、表現力のあるビューワやリーダーは、今までにひとつもありませんでした。

日本にはボイジャーのように、20年間にわたって電子書籍を一途にやってきた会社があります。また「青空文庫」というアーカイブもあります。そうした基盤の整備が固められていたからこそ、今のような発展があるのです。

EPUB 3と中国語繁体字

EPUB 3が制定されたとき、台湾の「資訊工業策進會」のエンジニアが一人参加していました。彼の熱情によって、EPUB 3は日本語だけではなく、中国語繁体字にもうまく対応することができるようになりました。

縦書きは、いまではもう中国本土にはない、台湾独自の文化です。中国ではかつて「文化大革命」がありましたよね。それ以後、中国語簡体字の書籍は、ほぼ全部が横書きです。また香港も中国語繁体字を使っていますが、イギリスの植民地だったこともあり、やはりほとんどの書籍が横書きです。台湾は中国語圏のなかで、縦書きを維持している、最後の場所になります。

私は今年(2012年)の国際電子出版EXPOに参加して以来、EPUB 3の制作技術を研究してきました。そのうちに、なんとか中国語繁体字の電子書籍を制作できるところまでたどり着きました。しかし、満足できる結果にいたるまでには、まだ基盤の一角が欠けています。それはフォントです。

中国語繁体字の問題としては、以下の三つがあります:

1)文字の数が多い
日本の漢字は、JIS第三、第四水準まで含めても、2万字くらいでしょう。また中国語簡体字なら、6000字あるだけでも実用に足るフォントになります。

しかし中国語繁体字は、政府機関が公表する公的書類文字交換コード「CNS11643」によると、9万以上の文字があります。しかも、実際にその全部を含んだフォントの一揃いがありません。Windowsのシステムフォント「新細明體」は7万字、OS Xのシステムフォント「黑體―繁」は5万字でしかありません。また書籍印刷用のフォントとしても、3万〜4万文字が必要となり、その容量は簡単に10MB以上になります。これらを作るのはかなり苦労でした。

2)フォントが古い
DTPがブームになったとき、台湾では華康(Dynafont)や文鼎(Arphic)といった会社が、いろいろなフォントを作りました。しかし、当時は国内用のBIG 5コードを使っており、文字の数も2万を超えていませんでした。その後、Unicodeに転換したときにも、よく使われている二つのフォント、明体(明朝体)と黒体(ゴシック体)だけに対応し、ほかのフォントはすべてBIG 5のまま放置されてしまいました。また約物なども古い基準のままなので、これらのフォントを指定しても、Readiumで見ると、使えないものだということがわかります。

システムフォントも古いものばかりなので、約物がバラバラ。

3)印刷用の書体が四種類がある
台湾には繁体字ともに、中国の印刷文化が保存されています。その伝統にしたがって本を作るときには、次の四種類の書体が必要になります。

・明体=宋体(日本の明朝体):これは書籍には必須の書体です。しかし残念ながら、iOSにはこのフォントが入っていません。iBooksで使えるのは、内蔵されている「黒体―繁」だけです。
黒体(日本のゴシック体):これはシステム用フォントなので、全部のシステムにあります、しかし、電子書籍には不向きな書体です。
・楷体:これは書道の書体で、繁体字ではまだまだよく使われています。
・仿宋:これは中国宋代に、木で活字を作るときに用いられた独自の書体です。木には繊維があるので、この書体は繊維の方向に沿って書かれる縦の筆順は細く、横の筆順は太くなっており、かなり美しいものです。いまは明体ともども、よく使われています。

印刷によく使われる四書体(右上から時計まわりに、楷体、仿宋、黒体、明体(宋体)。

これからの展開

中国語繁体字フォントの基盤が固まり、必要最低限である明・黒・楷三種類のフォントがそれぞれ4万文字に対応しました。これらは約物の横、縦対応やフォントデザインのベースラインなど新しいフォントの基準も満たしています。今後さらに望ましいのは、それら三種類のフォントがオープンフォント(BSD License)になることです。できれば、Windows、OS X、iOS、Android、Linuxなどのシステム内蔵フォントになり、自由になってほしいと思います。

上の写真は台北にある、台湾最後の一軒となった「日星鑄字行」という活字屋です。台湾でもっとも古い楷書活字を持っており、何万字もあるため、これらをデジタルによって保存することは大変です。

これらのフォントが電子化され、自由になることで、中国語繁体字の電子書籍がもっと広がることを私は望んでいます。目的は商売でもいいし、文化の保存でもいいのです。何千年も昔から現在まで生き続けてきた中国語繁体字と縦書き文化を、デジタルの力によって、この先も生き続けさせたいのです。

最後に、ワンダラーが制作したEPUB 3の見本をご紹介します(下記からダウンロードできます)

塑膠鴉片:http://wanderer.tw/post/34646924318/plastic-opium-epub-vertical-ebook-for-free-download

この作品は、著者からクリエイティブ・コモンズのライセンス(CC BY-NC-ND)によって開放されている作品です。ワンダラーの手によって、この作品の縦書きEPUB 3のファイルを作ってみました。Embedded Fontは台湾文鼎(Arphic)のオープンフォントAR PL MingU20-L明体です。ぜひ、お手元のEPUB 3ビューアで試してみてください。

■関連記事
台湾がOPDSでやろうとしていること
台湾の電子書籍プロジェクト「百年千書」