電子曞籍ずその圢匏: FB2 ず FB3 - 歎史、長所、短所、および動䜜原理

前回の蚘事でお話したしたが、 DjVuフォヌマットの特城。 今日は、FB2 ずしお知られる FictionBook2 フォヌマットずその「埌継」FB3 に焊点を圓おるこずにしたした。

電子曞籍ずその圢匏: FB2 ず FB3 - 歎史、長所、短所、および動䜜原理
/フリッカヌ/ ゞュディット・クラむン / CC

フォヌマットの倖芳

90幎代半ば、愛奜家たちは、 私たちは、開始したした ゜連の曞籍をデゞタル化する。 圌らは文孊をさたざたな圢匏で翻蚳しお保存したした。 Runet の最初のラむブラリの XNUMX ぀ - マキシム・モシュコフの図曞通 - フォヌマットされたテキスト ファむル (TXT) を䜿甚したした。

この遞択は、バむト砎損に察する耐性ず汎甚性により有利に行われたした。TXT はどのオペレヌティング システムでも開くこずができたす。 しかし、圌は、 難しくした 保存されたテキスト情報の凊理。 たずえば、999 行目に移動するには、その前の XNUMX 行を凊理する必芁がありたした。 本も 保管されおいる Word 文曞ず PDF では、埌者は他の圢匏に倉換するのが難しく、匱いコンピュヌタヌが開いたり、 衚瀺される PDF ドキュメントに遅延が発生したす。

HTML は電子文献を「保存」するためにも䜿甚されたした。 これにより、むンデックス䜜成、他の圢匏ぞの倉換、ドキュメントの䜜成 (テキストのタグ付け) が簡単になりたしたが、独自の欠点も生じたした。 最も重芁なものの XNUMX ぀は「曖昧さ» 暙準: タグを蚘述するずきに䞀定の自由を蚱可したした。 そのうちのいく぀かは閉鎖する必芁がありたしたが、その他のものたずえば、 ) - 閉じる必芁はありたせんでした。 タグ自䜓は、任意のネスト順序を持぀こずができたす。

そしお、そのようなファむルの操䜜は掚奚されおいたせんでしたが、そのような文曞は正しくないず考えられおいたしたが、暙準では、読者がコンテンツを衚瀺するこずを芁求しおいたした。 各アプリケヌションで「掚枬」のプロセスが独自の方法で実装されおいるため、ここで問題が発生したした。 同時に、圓時垂堎で入手可胜な読み取りデバむスずアプリケヌション 理解した XNUMX ぀たたは XNUMX ぀の特殊な圢匏。 ある曞籍が XNUMX ぀の圢匏で入手可胜である堎合、読むためには再フォヌマットする必芁がありたした。 これらすべおの欠点を解決するこずを目的ずしたものでした フィクションブック2、たたは FB2 は、テキストず倉換の最初の「結合」を匕き継ぎたす。

この圢匏には最初のバヌゞョンがあるこずに泚意しおください - フィクションブック1 - ただし、これは本質的に実隓的なものであり、長くは続かず、珟圚サポヌトされおおらず、䞋䜍互換性もありたせん。 したがっお、FictionBook はほずんどの堎合、その「埌継」である FB2 圢匏を意味したす。

FB2 は、次のような開発者グルヌプによっお䜜成されたした。 ドミトリヌ・グリボフリットル瀟のテクニカルディレクタヌであるミハむル・マツネフ氏ず、ハヌリ・リヌダヌの䜜成者であるミハむル・マツネフ氏です。 この圢匏は XML に基づいおおり、閉じられおいないタグやネストされたタグの凊理を HTML よりも厳密に芏制したす。 XML ドキュメントには、いわゆる XML スキヌマが付属しおいたす。 XML スキヌマは、すべおのタグを含み、タグの䜿甚芏則 (順序、ネスト、必須およびオプションなど) を蚘述する特別なファむルです。 FictionBook では、図は FictionBook2.xsd ファむルにありたす。 XML スキヌマの䟋は次の堎所にありたす。 リンク (liters 電子曞籍ストアで䜿甚されおいたす)。

FB2ドキュメント構造

文曞内のテキスト 保管 特別なタグ内 - 段萜タむプの芁玠: 、 そしお。 芁玠もあるよ、コンテンツはなく、ギャップを挿入するために䜿甚されたす。

すべおのドキュメントはルヌトタグで始たりたす、その䞋に衚瀺される堎合がありたす、 、 そしお。

鬌ごっこ他の圢匏ぞの倉換を容易にするスタむル シヌトが含たれおいたす。 でを䜿甚しお゚ンコヌドされた嘘 base64 ドキュメントをレンダリングするために必芁ずなる可胜性のあるデヌタ。

芁玠䜜品のゞャンル、著者のリスト (氏名、電子メヌル アドレス、Web サむト)、タむトル、キヌワヌドを含むブロック、泚釈など、本に関する必芁な情報がすべお含たれおいたす。 たた、文曞に加えられた倉曎に関する情報や、曞籍が玙で出版されおいる堎合はその出版瀟に関する情報も含たれる堎合がありたす。

ブロックの䞀郚はこんな感じですFictionBook ゚ントリヌで 䜜品 アヌサヌ・コナン・ドむル著「緋色の研究」より匕甚 プロゞェクト・グヌテンベルク:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

FictionBook ドキュメントの䞻芁なコンポヌネントは次のずおりです。 。 この本自䜓のテキストが含たれおいたす。 文曞党䜓にこれらのタグがいく぀か存圚する可胜性がありたす。远加のブロックは、脚泚、コメント、メモを保存するために䜿甚されたす。

FictionBook には、ハむパヌリンクを操䜜するためのタグもいく぀か甚意されおいたす。 それらは仕様に基づいおいたす Xリンク、コン゜ヌシアムによっお開発されたした W3C 特に、XML ドキュメント内の異なるリ゜ヌス間のリンクを䜜成する堎合に䜿甚したす。

フォヌマットの利点

FB2 暙準には、最小限必芁なタグのセット (フィクションを「デザむン」するのに十分なタグ) のみが含たれおいるため、読者による凊理が簡玠化されたす。 さらに、FB 圢匏でリヌダヌを盎接操䜜する堎合、ナヌザヌはほがすべおの衚瀺パラメヌタをカスタマむズするこずができたす。

ドキュメントの厳密な構造により、FB 圢匏から他の圢匏ぞの倉換プロセスを自動化できたす。 同じ構造により、本の著者、タむトル、ゞャンルなどによるフィルタヌの蚭定など、文曞の個々の芁玠を操䜜するこずが可胜になりたす。このため、FB2 圢匏は Runet で人気を博し、ロシアの電子図曞通や図曞通のデフォルト暙準ずなっおいたす。 CIS諞囜では。

フォヌマットのデメリット

FB2 圢匏のシンプルさは、利点であるず同時に欠点でもありたす。 これにより、耇雑なテキスト レむアりト (䜙癜内のメモなど) の機胜が制限されたす。 ベクトル グラフィックスや番号付きリストのサポヌトはありたせん。 このため、フォヌマットは あたり適しおいない 教科曞、参考曞、技術文献フィクションの本、たたは「フィクションの本」ずいう圢匏の名前でもそれに぀いお語られおいたす。

同時に、曞籍に関する最小限の情報 (タむトル、著者、衚玙) を衚瀺するために、プログラムは XML ドキュメントのほが党䜓を凊理する必芁がありたす。 これは、メタデヌタがテキストの先頭にあり、画像が最埌にあるためです。

FB3 - フォヌマット開発

曞籍テキストの曞匏蚭定に察する芁件が増加したため (FB2 のいく぀かの欠点を軜枛するために)、Gribov は FB3 圢匏の開発に取り組み始めたした。 その埌開発は䞭止されたしたが、2014幎に 再開したした.

著者らによるず、技術文献を出版する際の実際のニヌズを調査し、教科曞、参考曞、マニュアルを怜蚎し、あらゆる曞籍を衚瀺できるようにするためのより具䜓的なタグのセットの抂芁を説明したした。

新しい仕様では、FictionBook 圢匏はメタデヌタ、画像、テキストが別個のファむルずしお保存される zip アヌカむブです。 zip ファむル圢匏の芁件ずその構成に関する芏則は、暙準芏栌で指定されおいたす。 ECMA-376、Open XML を定矩したす。

曞匏蚭定 (スペヌス、䞋線) に関連しお倚くの改善が行われ、新しいオブゞェクトである「ブロック」が远加されたした。これは、本の任意の断片を四角圢の圢で曞匏蚭定し、回り蟌みでテキストに埋め蟌むこずができたす。 番号付きリストず箇条曞きリストがサポヌトされるようになりたした。

FB3 は無料ラむセンスで配垃され、オヌプン゜ヌスであるため、コンバヌタヌ、クラりド ゚ディタヌ、リヌダヌなど、発行者ずナヌザヌはすべおのナヌティリティを利甚できたす。 珟圚 のバヌゞョン フォヌマット、 読者 О реЎактПр プロゞェクトの GitHub リポゞトリにありたす。

䞀般に、FictionBook3 は兄に比べおただ普及しおいたせんが、いく぀かの電子ラむブラリはすでにこの圢匏の曞籍を提䟛しおいたす。 そしお、リットルズは数幎前、カタログ党䜓を新しい圢匏に移行する意向を発衚したした。 䞀郚のリヌダヌは、必芁なすべおの FB3 機胜をすでにサポヌトしおいたす。 たずえば、ONYX リヌダヌのすべおの最新モデルは、すぐにこの圢匏を䜿甚できたす。 ダヌりィン3 たたは クレオパトラ 3.

電子曞籍ずその圢匏: FB2 ず FB3 - 歎史、長所、短所、および動䜜原理
/ オニキス ボックス クレオパトラ 3

FictionBook3 のより広範な配垃により゚コシステムが圢成される 指向性のある 癜黒たたは小さなディスプレむ、メモリ䞍足など、リ゜ヌスが限られおいるデバむスでテキストを完党か぀効果的に操䜜するこずができたす。開発者によるず、䞀床レむアりトされた本は、どのような環境でも可胜な限り䟿利になるそうです。

PS ONYX BOOX 読者に関するいく぀かのレビュヌをご玹介したす。



出所 habr.com

コメントを远加したす