E-Books und ihre Formate: FB2 und FB3 – Geschichte, Vor- und Nachteile sowie Arbeitsprinzipien

Im vorherigen Artikel haben wir darüber gesprochen Funktionen des DjVu-Formats. Heute haben wir beschlossen, uns auf das FictionBook2-Format, besser bekannt als FB2, und seinen „Nachfolger“ FB3 zu konzentrieren.

E-Books und ihre Formate: FB2 und FB3 – Geschichte, Vor- und Nachteile sowie Arbeitsprinzipien
/flickr/ Judit Klein / CC

Das Erscheinungsbild des Formats

Mitte der 90er Jahre Enthusiasten wir begannen Sowjetische Bücher digitalisieren. Sie übersetzten und bewahrten Literatur in den unterschiedlichsten Formaten auf. Eine der ersten Bibliotheken in Runet - Bibliothek von Maxim Moshkov - eine formatierte Textdatei (TXT) verwendet.

Die Wahl fiel zu seinen Gunsten aufgrund seiner Widerstandsfähigkeit gegen Bytekorruption und seiner Vielseitigkeit – TXT lässt sich auf jedem Betriebssystem öffnen. Allerdings, er machte es schwierig Verarbeitung gespeicherter Textinformationen. Um beispielsweise zur tausendsten Zeile zu gelangen, mussten 999 Zeilen davor verarbeitet werden. Bücher auch gelagert in Word-Dokumenten und PDF - letzteres war schwierig in andere Formate zu konvertieren, und schwache Computer öffneten und angezeigt PDF-Dokumente mit Verzögerungen.

HTML wurde auch zur „Speicherung“ elektronischer Literatur verwendet. Es erleichterte die Indizierung, die Konvertierung in andere Formate und die Dokumentenerstellung (Tagging von Text), brachte jedoch auch eigene Mängel mit sich. Eines der bedeutendsten war „Vagheit» Standard: Er erlaubte bestimmte Freiheiten beim Schreiben von Tags. Einige davon mussten geschlossen werden, andere (zum Beispiel ) – es war nicht nötig, es zu schließen. Die Tags selbst könnten eine beliebige Verschachtelungsreihenfolge haben.

Und obwohl eine solche Arbeit mit Dateien nicht gefördert wurde – solche Dokumente galten als falsch – verlangte der Standard von den Lesern, dass sie versuchen, den Inhalt anzuzeigen. Hier traten Schwierigkeiten auf, da in jeder Anwendung der Prozess des „Ratens“ auf seine eigene Weise umgesetzt wurde. Gleichzeitig wurden die damals auf dem Markt verfügbaren Lesegeräte und Anwendungen angepasst verstanden ein oder zwei spezialisierte Formate. Wenn ein Buch in einem Format verfügbar war, musste es neu formatiert werden, um gelesen zu werden. All diese Mängel sollten behoben werden BelletristikBuch2, oder FB2, der das anfängliche „Kämmen“ des Textes und die Konvertierung übernahm.

Beachten Sie, dass das Format seine erste Version hatte - BelletristikBuch1 - Allerdings war es nur experimenteller Natur, hielt nicht lange, wird derzeit nicht unterstützt und ist nicht abwärtskompatibel. Daher meint FictionBook am häufigsten seinen „Nachfolger“ – das FB2-Format.

FB2 wurde von einer Gruppe von Entwicklern unter der Leitung von erstellt Dmitri Gribow, der technische Direktor des Liters-Unternehmens, und Mikhail Matsnev, der Schöpfer des Haali Readers. Das Format basiert auf XML, das die Arbeit mit nicht geschlossenen und verschachtelten Tags strenger regelt als HTML. Zu einem XML-Dokument gehört ein sogenanntes XML-Schema. Ein XML-Schema ist eine spezielle Datei, die alle Tags enthält und die Regeln für deren Verwendung beschreibt (Reihenfolge, Verschachtelung, obligatorisch und optional usw.). In FictionBook befindet sich das Diagramm in der Datei FictionBook2.xsd. Ein Beispiel-XML-Schema finden Sie unter Link (wird vom Liters E-Book Store verwendet).

FB2-Dokumentstruktur

Text im Dokument behalten in speziellen Tags - Elemente von Absatztypen: , Und . Es gibt auch ein Element , das keinen Inhalt hat und zum Einfügen von Lücken dient.

Alle Dokumente beginnen mit einem Root-Tag , darunter möglicherweise angezeigt , , Und .

Etikett enthält Stylesheets, um die Konvertierung in andere Formate zu erleichtern. IN Lüge codiert mit base64 Daten, die möglicherweise zum Rendern des Dokuments erforderlich sind.

Element enthält alle notwendigen Informationen zum Buch: Genre des Werkes, Liste der Autoren (vollständiger Name, E-Mail-Adresse und Website), Titel, Block mit Schlüsselwörtern, Anmerkung. Es kann auch Informationen über am Dokument vorgenommene Änderungen und Informationen über den Herausgeber des Buchs enthalten, wenn es auf Papier veröffentlicht wurde.

So sieht ein Teil des Blocks aus im FictionBook-Eintrag für funktioniert „A Study in Scarlet“ von Arthur Conan Doyle, entnommen aus Projekt Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Die Schlüsselkomponente eines FictionBook-Dokuments ist . Es enthält den Text des Buches selbst. Im gesamten Dokument können mehrere dieser Tags vorhanden sein – zusätzliche Blöcke werden zum Speichern von Fußnoten, Kommentaren und Notizen verwendet.

FictionBook bietet außerdem mehrere Tags für die Arbeit mit Hyperlinks. Sie basieren auf der Spezifikation XLink, vom Konsortium entwickelt W3C speziell zum Erstellen von Verknüpfungen zwischen verschiedenen Ressourcen in XML-Dokumenten.

Vorteile des Formats

Der FB2-Standard enthält nur den minimal erforderlichen Satz an Tags (ausreichend, um Belletristik zu „designen“), was die Verarbeitung durch Leser vereinfacht. Darüber hinaus hat der Benutzer bei direkter Bedienung des Readers mit dem FB-Format die Möglichkeit, nahezu alle Anzeigeparameter individuell anzupassen.

Die strenge Struktur des Dokuments ermöglicht es Ihnen, den Konvertierungsprozess vom FB-Format in ein anderes zu automatisieren. Die gleiche Struktur ermöglicht die Arbeit mit einzelnen Elementen von Dokumenten – das Einrichten von Filtern nach Buchautoren, Titel, Genre usw. Aus diesem Grund hat das FB2-Format in Runet an Popularität gewonnen und ist zum Standardstandard in russischen elektronischen Bibliotheken und Bibliotheken geworden in den GUS-Staaten.

Nachteile des Formats

Die Einfachheit des FB2-Formats ist gleichzeitig sein Vor- und Nachteil. Dies schränkt die Funktionalität für komplexe Textlayouts (z. B. Notizen am Rand) ein. Es verfügt nicht über Vektorgrafiken oder unterstützt nummerierte Listen. Aus diesem Grund ist das Format nicht sehr geeignet für Lehrbücher, Nachschlagewerke und Fachliteratur (der Name des Formats spricht sogar dafür – Belletristik oder „Fiction-Buch“).

Gleichzeitig muss das Programm fast das gesamte XML-Dokument verarbeiten, um minimale Informationen zum Buch anzuzeigen – Titel, Autor und Cover. Dies liegt daran, dass Metadaten am Anfang des Textes und Bilder am Ende stehen.

FB3 - Formatentwicklung

Aufgrund der gestiegenen Anforderungen an die Formatierung von Buchtexten (und um einige der Mängel von FB2 abzumildern), begann Gribov mit der Arbeit am FB3-Format. Die Entwicklung wurde später gestoppt, aber im Jahr 2014 war es soweit wieder aufgenommen.

Den Autoren zufolge untersuchten sie die tatsächlichen Bedürfnisse bei der Veröffentlichung technischer Literatur, schauten sich Lehrbücher, Nachschlagewerke und Handbücher an und skizzierten einen spezifischeren Satz von Tags, der die Anzeige jedes Buches ermöglichen würde.

In der neuen Spezifikation handelt es sich beim FictionBook-Format um ein Zip-Archiv, in dem Metadaten, Bilder und Text als separate Dateien gespeichert werden. Anforderungen an das ZIP-Dateiformat und Konventionen für seine Organisation sind im Standard festgelegt ECMA-376, das Open XML definiert.

Im Zusammenhang mit der Formatierung (Abstand, Unterstreichung) wurden eine Reihe von Verbesserungen vorgenommen und ein neues Objekt hinzugefügt – ein „Block“ – der ein beliebiges Fragment eines Buches in Form eines Vierecks formatiert und mit einem Umbruch in den Text eingebettet werden kann. Es gibt jetzt Unterstützung für nummerierte und Aufzählungslisten.

FB3 wird unter einer kostenlosen Lizenz vertrieben und ist Open Source, sodass Herausgebern und Benutzern alle Dienstprogramme zur Verfügung stehen: Konverter, Cloud-Editoren, Reader. Aktuell Version Format, Leser и редактор finden Sie im GitHub-Repository des Projekts.

Generell ist FictionBook3 noch weniger verbreitet als sein älterer Bruder, mehrere elektronische Bibliotheken bieten jedoch bereits Bücher in diesem Format an. Und vor ein paar Jahren kündigte Liters an, seinen gesamten Katalog auf ein neues Format umstellen zu wollen. Einige Reader unterstützen bereits alle notwendigen FB3-Funktionalitäten. Beispielsweise können alle modernen Modelle von ONYX-Lesegeräten sofort mit diesem Format arbeiten, z. B. Darwin 3 oder Kleopatra 3.

E-Books und ihre Formate: FB2 und FB3 – Geschichte, Vor- und Nachteile sowie Arbeitsprinzipien
/ ONYX-BOX Kleopatra 3

Eine breitere Verbreitung von FictionBook3 wird ein Ökosystem schaffen orientiert um mit Text auf jedem Gerät mit begrenzten Ressourcen vollständig und effektiv zu arbeiten: Schwarzweiß oder kleiner Bildschirm, wenig Speicher usw. Laut den Entwicklern wird ein Buch, sobald es einmal ausgelegt ist, in jeder Umgebung so praktisch wie möglich sein.

PS: Wir machen Sie auf mehrere Rezensionen von ONYX BOOX-Lesern aufmerksam:



Source: habr.com

Kommentar hinzufügen