370 likes | 465 Views
JEPAX 説明会. 下川 和男 ・ 渋谷 誠 EAST Co.,Ltd. JEPAX の目的. 出版社が社内に保有する「テキスト系」 デジタルデータの標準交換フォーマット 対象は、文庫、新書、一般書など 辞書、雑誌、新聞などは対象外 各種の配布フォーマットに変換可能 Free & Open. JEPAX のコンセプト. シンプルなタグ XML を使用→将来性、拡張性、豊富なツール 文書の論理構造を規定 「交換」≠「配布」フォーマット 外字の扱いを規定 外字 の指定方法を規定 、欧文外字も 国際化への対応 Unicodeも使用可能.
E N D
JEPAX説明会 下川 和男 ・ 渋谷 誠 EAST Co.,Ltd.
JEPAXの目的 • 出版社が社内に保有する「テキスト系」デジタルデータの標準交換フォーマット • 対象は、文庫、新書、一般書など • 辞書、雑誌、新聞などは対象外 • 各種の配布フォーマットに変換可能 • Free & Open
JEPAXのコンセプト • シンプルなタグ • XMLを使用→将来性、拡張性、豊富なツール • 文書の論理構造を規定 「交換」≠「配布」フォーマット • 外字の扱いを規定 • 外字の指定方法を規定、欧文外字も • 国際化への対応 • Unicodeも使用可能
配布フォーマットへの変換 標準で以下の変換が可能(XSLフィルター) • HTML→ ブラウザーで読める • Open eBook(予定) • T-Time→ 出版には、Publishers Kitが必要 • Book Jacket(凸版殿) • 文庫DTD(大日本スクリーン殿) • 電子書籍コンソーシアム・テキスト(交渉中) • Net EB(電子ブックコミッティー殿、交渉中)
Free & Open • 自由にJEPAX仕様を利用できる • 誰に何の料金も支払う必要がない • Free & Openの対象は • JEPAX仕様、JEPAXという名称 • XSLフィルターのサンプル • HTML、T-Time、Open eBookなど
交換フォーマットの必要性 • 最終フォーマットによらず必要な作業 • ルビ、外字を探す • 段落を区切って見出しを取り出す • 書誌情報を作成 • これらが完了後の状態で保存、交換 • 安心して使える共通フォーマット • 表計算のCSV、ワープロのRTFのようなもの
HTMLではだめなのか? • 増えすぎてしまったタグ • 日本語用仕様の欠如 • 論理構造定義が弱い • 書誌情報も必要
設計方針 • XML準拠 • 簡潔さ • 論理構造重視―スタイル指定の排除 • 変換の容易性
文書形式 • 検証済みXML文書 • DTDは仕様とともに公開 <!DOCTYPE jepax PUBLIC “-//JEPA//DTD JEPAX 1.0//JA” “http://x.jepa.or.jp/jepax/jepax10.dtd” > • ファイルのEncoding • Unicode(UTF-16)を推奨 • 他のEncodingも許容する • 使用文字が外字の指定方法 • 明確なガイドラインを提示
全体構造 • トップレベルの5つの要素 jepax bookinfo front body back
div要素 div + + head div p pre table ol ul dl title subtitle author note graphic ブロック要素の繰り返し
論理構造の表現 • div要素ひとつだけを使う • 入れ子にして階層を表現 • 属性値 type = で意味を付加 • “part”, “chapter”, “section” • “foreword”, “backword” • “appendix”, “index”, “glossary”, “toc” • “quote”, “cover” • その他任意の文字列
階層定義の例 <div type=”chapter”> <head> <title>第一章 電子出版の歴史</title> </head> <div type=”section”> <head> <title>1.黎明期</title> <subtitle>CD-ROM辞書の時代</subtitle> </head> ・・・ (本文) ・・・ </div> </div>
パラグラフ p 整形テキスト pre リスト ol,ul,li dl,dt,dd 表 table,caption,tr,th,td グラフィック graphic, img 注 note ブロック要素
インライン要素(1) • em • 強調 • 属性値 rend = <文字列>で強調方法を指定 • “italic”, “bold”, “gothic”, “underline”, “sidedot” <em rend=“sidedot”>何の料金も</em>支払う必要がない • span • いろいろな目的で使える汎用マークアップ • 属性値 class = <文字列>で意味を指定 <span class=”URL” >http://www.jepa.or.jp/</span>
インライン要素(2) • sup,sub • 上付、下付 • ref • 参照(内部リンク) • 属性値 idref = <IDREF>で参照先を指定 • 属性値 type = <文字列>で参照先の種別を指定 • “figure”, “photo”, “artwork”, “table”, “note” <ref idref=”fig13” type=”figure”>図13</noteref>参照
インライン要素(3) • ruby,rb.rt • ルビ • W3C案に準拠 <ruby><rb>株式会社</rb><rt>かぶしきがいしゃ</rt></ruby> • mlg • 割注
インライン要素(4) • yoko • 縦中横 <yoko>’99</yoko>年 • tate • 和文扱いの欧文 <tate>PTA</tate> • swdir, ht, vt • 縦横による文字列切り替え <swdir><ht>上の</ht><vt>右の</vt></swdir>表において
外字 • Unicodeにもない文字 • 正確な字形を指定したい • udc要素を使って指定 • 属性値 set=<文字列> で文字集合 • 属性値 number=<文字列> で番号 <udc set="mojikyo" number="95284"/>
Dublin Core Initiative の15要素 分離して利用されることを想定 namespaceを使用(prefix “bi”) JIS1,2水準の範囲のコードに限定 bi:title bi:creator bi:subject bi:description bi:publisher bi:contributor bi:date bi:type bi:format bi:identifier bi: source bi:language bi: relation bi: coverage bi:rights 書誌情報
文字の種類(1) • ASCII • ASCII以外の欧文文字 • 通常は表示できない • 半角カタカナ • 表示できない環境もある • JIS1,2水準
文字の種類(2) • Windows拡張 • 13区記号、IBM/NEC拡張漢字 • Windowsでだけ表示可能 • その他のUnicode範囲の文字 • JIS補助漢字も含まれる • UnicodeフォントがあればWindowsで表示可能
文字の種類(3) • その他の文字 • Unicodeにない文字 • あっても希望する字形と異なる場合 • 通常の文字としては表示は不可能
文字指定の方法(1) • 通常の文字コード • 環境によっては表示できないこともある • ISOの文字名称 • 欧文のみ • á; ü
文字指定の方法(2) • UCS文字番号 • XMLの仕様で規定されている方法 • ㈱ • <UDC>タグ • JEPAXで規定した方法 • <udc set="mojikyo" number="47268" />
JEPAXの指針 • 3つのレベルのガイドライン • 完全Unicode環境用 • Windows環境用 • 汎用環境用 • 相互変換は可能
XML Notepad • XMLエディタ • Microsoftがβ版公開中 • http://msdn.microsoft.com/xml/notepad/intro.asp • 日本語が入力できない • 表示だけならできる • DTDを指定して文書構造の検証も可能
iHTML • XSLTプロセッサ • XSLファイルで変換方法を指定して、XMLファイル同士を変換 • インフォテリアがβ版公開中 • http://www.infoteria.com/jp/download/index2.html
Internet Explorer 5.0 • XML対応ブラウザ • Microsoftが無償提供中 • http://www.microsoft.com/windows/ie_intl/ja/default.htm • ただの XML ファイル • 構造解析してツリー表示 • XSLファイルを指定したXMLファイル • XSLに従ってHTMLに変換して表示
今昔文字鏡 • 9万字の文字を収録、分類 • エーアイ・ネットの製品 • フォントは公開 • TrueTypeとGIFのビットマップ • 文字鏡研究会 • http://www.mojikyo.gr.jp/index_j.htm
お願いしたい事 • 1.0版策定へのご意見 • 出版社、印刷会社殿へ • JEPAXコンテンツの試作 • ビュアー会社殿へ • フィルター開発への協力
今後の議論 • メーリングリスト(ML)を使用 • 対象:JEPA+EB、EBJ、EPWING参加会社 • http://x.jepa.or.jp/jepax/ml.htm • 個別メールも歓迎 • mshibuya@est.co.jpまで • JEPA委員会で、9月中に仕様を決定