"Sigil"を活用したePub電子書籍作りでの、日本語表示上の注意点/"UTF-8 format" ......

| | コメント(0) | トラックバック(1)

 かつて自分は、リナックス・サーバー上にWebサイト関連ファイルをアップロードする際、 "文字コード" というものに梃子摺った覚えがある。ローカルPCサイドではほとんど問題視されない "文字コード" の問題が、サーバーサイドでは "文字表示不能" やいわゆる "文字化け" 現象となって現れるからだ。
 ローカルPCサイドでは、Webスクリプトを書く際、かつては "秀丸エディター" なぞを常用し、オプション設定の "文字コード" は "SHIFT-JIS" あたりを汎用していた。
 つまり、万事を "SHIFT-JIS" フォーマットのファイルで押し通そうとしてたわけだ。ところが、サーバー上の他のWebサイト関連ファイルが、 "Unicode(ユニコード)" の "UTF-8" フォーマットであったから、文字表示問題が表面化したのであった。
 それからは、多少面倒ではあるが "秀丸エディター" を使う時にも、Webサイト関連ファイルをいじる際には、 "文字コード" 設定をいちいち "UTF-8" フォーマットに変更してファイルを開いたり、保存したりすることにした。
 ある時期からは、Webサイト関連ファイルをいじる際には、 "Adobe Dreamweaver CS4" なんぞという "大道具(?)" を利用させてもらっているから気にしないで済んだ。
 ただ、シンプルなテキスト・エディターも重宝なので使ってきたが、 "文字コード" の変更が必要な場合にはフリーソフトのテキストエディター< TeraPad >を便利さゆえに使わせてもらっている。
 シンプルな< TeraPad >には、「ファイル」-「文字/改行コード指定保存」という機能があって、 "SHIFT-JIS" コードあたりで作ったファイルを、簡単に "Unicode(ユニコード)" の "UTF-8" フォーマットに変換出力できるからである。

 さて、以上は長々とした前置きであった。
 ところで、"Text 文書" の "ePub" 化で、優れたパワーを発揮する "Sigil" なのであるが、どうも使い始めたその場で "挫折(?)" してしまうユーザーもあると聞いている。
 つまり、所定の "Text 文書" のファイルを「Open」しようとしたところ、「エラーメッセージ」に見舞われたり、うまく土俵に載せてもらっても "文字化け" となっていたりするというわけらしい。
 この原因の大半は、所定の "Text 文書" のファイルが、 "Unicode(ユニコード)" の "UTF-8" フォーマットでは「ない」ことによるものだろう。

 ちなみに、< epub 電子書籍チュートリアル>というサイトでも、「手作業による ePub 電子書籍の作り方」の中で、HTML や text などで書かれたコンテンツを準備する際、 "文字コード" に関しては以下のごとくするよう念を押している。

「これらの(コンテンツ)ファイルをテキスト・エディターで作る場合は、 "UTF-8 format" で保存してね。 "ANSI規格準拠" ではダメだからね。」と。
<If you are creating these files in a text editor, be sure to save in UTF-8 format, not ANSI. >(<.epub eBooks Tutorial/How to Make an ePub eBook by Hand>

  "ANSI" とは日本で言えば "JIS" であり、具体的な "文字コード" では "JIS" とか "SHIFT-JIS" などがこれに当たるわけだ。

 だから、当該のファイルを段取りよく "UTF-8" フォーマットに変換出力し、それとわかるようにファイル名の末尾に "UTF-8" とでも付け足して保存したファイル(ex. "~_UTF-8.txt" )を再び "Sigil" で「Open」してみると、まともな "Text 文書" が "Sigil" の画面の右側に表示されるはずである。

 これで、いろいろと "編集" 作業に入り( ツールバー「View」から「Code View」をクリックすれば、 "Text 文書" の画面は、 "XHTML" スクリプト画面に切り替わったりする...... )、それが終わったら「Save As」で適当なフォルダーに "~_UTF-8.epub" として保存すれば完了するというわけだ。
 その "~_UTF-8.epub" を、 "Adobe Digital Editions" という "Epub 電子書籍ビューアー" などで、 "Epub 電子書籍" として試しに開いてみるとよい。
 が、実は、ここで再びと言うか、本来的なと言うか "文字化け" 現象! に遭遇することになるはずである。
 しかし、落胆(?)することはないのであって、上記の "Sigil" のツールバー「View」から「Code View」をクリックすれば、 "Text 文書" の画面は、 "XHTML" スクリプト画面に切り替わったりする......、に戻って "XHTML" スクリプトの上部にあるスクリプト行を "チョイト書き足して" 保存し直せば "文字化け" 現象は "お化け" さながらに消え失せるというわけなのである。
 参考までに、その辺の "変更事情" を紹介しておくと以下のようになる。

<英語のサンプルの文字を単に日本語に直しただけでは、日本語は表示されませんでした。下記リンクのとおり、XHTMLファイルに言語指定を加える必要がありました。
 「Sigilで作成した日本語ePUBコンテンツの文字化けを修正する方法」
 要約すると、本文のXHTMLファイルのHTML宣言に言語を指定する必要がある、ということです。
<html xmlns="http://www.w3.org/1999/xhtml">
               ↓
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="ja" lang="ja">
 この修正で日本語の表示が確かにうまくいきました。>(「日本語Epubブックサンプル」(提供: 横浜工文社)

 こうして振り返ってみると、"epub 電子書籍" 作りというのは、実は "Webスクリプト編集作業" 、 "HTML 編集作業" 、正確には "XHTML 編集作業" そのものなんですね...... (2010.08.18)













【 SE Assessment 】 【 プロジェクトα 再挑戦者たち 】








トラックバック(1)

このブログ記事を参照しているブログ一覧: "Sigil"を活用したePub電子書籍作りでの、日本語表示上の注意点/"UTF-8 format" ......

このブログ記事に対するトラックバックURL: http://adhocrat.net/mt/mt-tb.cgi/1225

日本の電子書籍は遅れている? 日本の電子書籍業界は米国に大きく遅れをとったように見える。 しかし、iPhoneやiPadが大流行している日本では電子書籍... 続きを読む

コメントする

2020年11月

1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          














関連サイトへのリンク


  • 電子書籍(eBooks)制作にフォーカスしたサイト
  • 明けない夜はないことを確信するサイト
  • Green(地球環境改善)にフォーカスしたサイト
  • ソフトウェア技術者やSEのための評価と育成、人事考課制度を考えるサイト
  • さまざまな業種・業態でご利用可能なモバイル活用の予約システム!
  • 創作小説『海念と保兵衛』のサイト
  • 創作小説『かもめたちの行方』のサイト
  • 当ブログ推奨の商品を展示したAmazon ストアー!
  • 当AdhocBlogブログの過去のエントリー
  • 株式会社アドホクラット当時のサイト

★売れ筋! No.1!
家庭用"放射線測定器"

日本通信 bモバイルWiFi ルータ+1 ヶ月定額SIM BM-U300W-1M
価格:¥ 20,208
国内配送料無料 Amazon





このブログ記事について

このページは、yasuo hiroseが2010年8月18日 00:44に書いたブログ記事です。

ひとつ前のブログ記事は、
 「"Sigil"と同種の"ePub変換"ソフト"eCub"のメリットは、"カバー・ページ"挿入可か? ......
です。

次のブログ記事は、
 「電子書籍の"検索可能PDF文書"を首尾よく作る/"300 dpi"以上/"ScanSnap S1500" ......
です。

最近のコンテンツは、
 インデックスページ
で見られます。

過去に書かれたものは、
 アーカイブのページ
で見られます。

年月別アーカイブ