E-Books und ihre Formate: FB2 und FB3 – Geschichte, Vor- und Nachteile sowie Arbeitsprinzipien

Im vorherigen Artikel haben wir darĂŒber gesprochen Funktionen des DjVu-Formats. Heute haben wir beschlossen, uns auf das FictionBook2-Format, besser bekannt als FB2, und seinen „Nachfolger“ FB3 zu konzentrieren.

E-Books und ihre Formate: FB2 und FB3 – Geschichte, Vor- und Nachteile sowie Arbeitsprinzipien
/flickr/ Judit Klein / CC

Das Erscheinungsbild des Formats

Mitte der 90er Jahre Enthusiasten wir begannen Sowjetische BĂŒcher digitalisieren. Sie ĂŒbersetzten und bewahrten Literatur in den unterschiedlichsten Formaten auf. Eine der ersten Bibliotheken in Runet - Bibliothek von Maxim Moshkov - eine formatierte Textdatei (TXT) verwendet.

Die Wahl fiel zu seinen Gunsten aufgrund seiner WiderstandsfĂ€higkeit gegen Bytekorruption und seiner Vielseitigkeit – TXT lĂ€sst sich auf jedem Betriebssystem öffnen. Allerdings, er machte es schwierig Verarbeitung gespeicherter Textinformationen. Um beispielsweise zur tausendsten Zeile zu gelangen, mussten 999 Zeilen davor verarbeitet werden. BĂŒcher auch gelagert in Word-Dokumenten und PDF - letzteres war schwierig in andere Formate zu konvertieren, und schwache Computer öffneten und angezeigt PDF-Dokumente mit Verzögerungen.

HTML wurde auch zur „Speicherung“ elektronischer Literatur verwendet. Es erleichterte die Indizierung, die Konvertierung in andere Formate und die Dokumentenerstellung (Tagging von Text), brachte jedoch auch eigene MĂ€ngel mit sich. Eines der bedeutendsten war „Vagheit» Standard: Er erlaubte bestimmte Freiheiten beim Schreiben von Tags. Einige davon mussten geschlossen werden, andere (zum Beispiel ) – es war nicht nötig, es zu schließen. Die Tags selbst könnten eine beliebige Verschachtelungsreihenfolge haben.

Und obwohl eine solche Arbeit mit Dateien nicht gefördert wurde – solche Dokumente galten als falsch – verlangte der Standard von den Lesern, dass sie versuchen, den Inhalt anzuzeigen. Hier traten Schwierigkeiten auf, da in jeder Anwendung der Prozess des „Ratens“ auf seine eigene Weise umgesetzt wurde. Gleichzeitig wurden die damals auf dem Markt verfĂŒgbaren LesegerĂ€te und Anwendungen angepasst verstanden ein oder zwei spezialisierte Formate. Wenn ein Buch in einem Format verfĂŒgbar war, musste es neu formatiert werden, um gelesen zu werden. All diese MĂ€ngel sollten behoben werden BelletristikBuch2, oder FB2, der das anfĂ€ngliche „KĂ€mmen“ des Textes und die Konvertierung ĂŒbernahm.

Beachten Sie, dass das Format seine erste Version hatte - BelletristikBuch1 - Allerdings war es nur experimenteller Natur, hielt nicht lange, wird derzeit nicht unterstĂŒtzt und ist nicht abwĂ€rtskompatibel. Daher meint FictionBook am hĂ€ufigsten seinen „Nachfolger“ – das FB2-Format.

FB2 wurde von einer Gruppe von Entwicklern unter der Leitung von erstellt Dmitri Gribow, der technische Direktor des Liters-Unternehmens, und Mikhail Matsnev, der Schöpfer des Haali Readers. Das Format basiert auf XML, das die Arbeit mit nicht geschlossenen und verschachtelten Tags strenger regelt als HTML. Zu einem XML-Dokument gehört ein sogenanntes XML-Schema. Ein XML-Schema ist eine spezielle Datei, die alle Tags enthĂ€lt und die Regeln fĂŒr deren Verwendung beschreibt (Reihenfolge, Verschachtelung, obligatorisch und optional usw.). In FictionBook befindet sich das Diagramm in der Datei FictionBook2.xsd. Ein Beispiel-XML-Schema finden Sie unter Link (wird vom Liters E-Book Store verwendet).

FB2-Dokumentstruktur

Text im Dokument behalten in speziellen Tags - Elemente von Absatztypen: , Und . Es gibt auch ein Element , das keinen Inhalt hat und zum EinfĂŒgen von LĂŒcken dient.

Alle Dokumente beginnen mit einem Root-Tag , darunter möglicherweise angezeigt , , Und .

Etikett enthĂ€lt Stylesheets, um die Konvertierung in andere Formate zu erleichtern. IN LĂŒge codiert mit base64 Daten, die möglicherweise zum Rendern des Dokuments erforderlich sind.

Element enthĂ€lt alle notwendigen Informationen zum Buch: Genre des Werkes, Liste der Autoren (vollstĂ€ndiger Name, E-Mail-Adresse und Website), Titel, Block mit SchlĂŒsselwörtern, Anmerkung. Es kann auch Informationen ĂŒber am Dokument vorgenommene Änderungen und Informationen ĂŒber den Herausgeber des Buchs enthalten, wenn es auf Papier veröffentlicht wurde.

So sieht ein Teil des Blocks aus im FictionBook-Eintrag fĂŒr funktioniert „A Study in Scarlet“ von Arthur Conan Doyle, entnommen aus Projekt Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Die SchlĂŒsselkomponente eines FictionBook-Dokuments ist . Es enthĂ€lt den Text des Buches selbst. Im gesamten Dokument können mehrere dieser Tags vorhanden sein – zusĂ€tzliche Blöcke werden zum Speichern von Fußnoten, Kommentaren und Notizen verwendet.

FictionBook bietet außerdem mehrere Tags fĂŒr die Arbeit mit Hyperlinks. Sie basieren auf der Spezifikation XLink, vom Konsortium entwickelt W3C speziell zum Erstellen von VerknĂŒpfungen zwischen verschiedenen Ressourcen in XML-Dokumenten.

Vorteile des Formats

Der FB2-Standard enthĂ€lt nur den minimal erforderlichen Satz an Tags (ausreichend, um Belletristik zu „designen“), was die Verarbeitung durch Leser vereinfacht. DarĂŒber hinaus hat der Benutzer bei direkter Bedienung des Readers mit dem FB-Format die Möglichkeit, nahezu alle Anzeigeparameter individuell anzupassen.

Die strenge Struktur des Dokuments ermöglicht es Ihnen, den Konvertierungsprozess vom FB-Format in ein anderes zu automatisieren. Die gleiche Struktur ermöglicht die Arbeit mit einzelnen Elementen von Dokumenten – das Einrichten von Filtern nach Buchautoren, Titel, Genre usw. Aus diesem Grund hat das FB2-Format in Runet an PopularitĂ€t gewonnen und ist zum Standardstandard in russischen elektronischen Bibliotheken und Bibliotheken geworden in den GUS-Staaten.

Nachteile des Formats

Die Einfachheit des FB2-Formats ist gleichzeitig sein Vor- und Nachteil. Dies schrĂ€nkt die FunktionalitĂ€t fĂŒr komplexe Textlayouts (z. B. Notizen am Rand) ein. Es verfĂŒgt nicht ĂŒber Vektorgrafiken oder unterstĂŒtzt nummerierte Listen. Aus diesem Grund ist das Format nicht sehr geeignet fĂŒr LehrbĂŒcher, Nachschlagewerke und Fachliteratur (der Name des Formats spricht sogar dafĂŒr – Belletristik oder „Fiction-Buch“).

Gleichzeitig muss das Programm fast das gesamte XML-Dokument verarbeiten, um minimale Informationen zum Buch anzuzeigen – Titel, Autor und Cover. Dies liegt daran, dass Metadaten am Anfang des Textes und Bilder am Ende stehen.

FB3 - Formatentwicklung

Aufgrund der gestiegenen Anforderungen an die Formatierung von Buchtexten (und um einige der MÀngel von FB2 abzumildern), begann Gribov mit der Arbeit am FB3-Format. Die Entwicklung wurde spÀter gestoppt, aber im Jahr 2014 war es soweit wieder aufgenommen.

Den Autoren zufolge untersuchten sie die tatsĂ€chlichen BedĂŒrfnisse bei der Veröffentlichung technischer Literatur, schauten sich LehrbĂŒcher, Nachschlagewerke und HandbĂŒcher an und skizzierten einen spezifischeren Satz von Tags, der die Anzeige jedes Buches ermöglichen wĂŒrde.

In der neuen Spezifikation handelt es sich beim FictionBook-Format um ein Zip-Archiv, in dem Metadaten, Bilder und Text als separate Dateien gespeichert werden. Anforderungen an das ZIP-Dateiformat und Konventionen fĂŒr seine Organisation sind im Standard festgelegt ECMA-376, das Open XML definiert.

Im Zusammenhang mit der Formatierung (Abstand, Unterstreichung) wurden eine Reihe von Verbesserungen vorgenommen und ein neues Objekt hinzugefĂŒgt – ein „Block“ – der ein beliebiges Fragment eines Buches in Form eines Vierecks formatiert und mit einem Umbruch in den Text eingebettet werden kann. Es gibt jetzt UnterstĂŒtzung fĂŒr nummerierte und AufzĂ€hlungslisten.

FB3 wird unter einer kostenlosen Lizenz vertrieben und ist Open Source, sodass Herausgebern und Benutzern alle Dienstprogramme zur VerfĂŒgung stehen: Konverter, Cloud-Editoren, Reader. Aktuell Version Format, Leser Đž рДЎаĐșŃ‚ĐŸŃ€ finden Sie im GitHub-Repository des Projekts.

Generell ist FictionBook3 noch weniger verbreitet als sein Ă€lterer Bruder, mehrere elektronische Bibliotheken bieten jedoch bereits BĂŒcher in diesem Format an. Und vor ein paar Jahren kĂŒndigte Liters an, seinen gesamten Katalog auf ein neues Format umstellen zu wollen. Einige Reader unterstĂŒtzen bereits alle notwendigen FB3-FunktionalitĂ€ten. Beispielsweise können alle modernen Modelle von ONYX-LesegerĂ€ten sofort mit diesem Format arbeiten, z. B. Darwin 3 oder Kleopatra 3.

E-Books und ihre Formate: FB2 und FB3 – Geschichte, Vor- und Nachteile sowie Arbeitsprinzipien
/ ONYX-BOX Kleopatra 3

Eine breitere Verbreitung von FictionBook3 wird ein Ökosystem schaffen orientiert um mit Text auf jedem GerĂ€t mit begrenzten Ressourcen vollstĂ€ndig und effektiv zu arbeiten: Schwarzweiß oder kleiner Bildschirm, wenig Speicher usw. Laut den Entwicklern wird ein Buch, sobald es einmal ausgelegt ist, in jeder Umgebung so praktisch wie möglich sein.

PS: Wir machen Sie auf mehrere Rezensionen von ONYX BOOX-Lesern aufmerksam:



Source: habr.com

Kaufen Sie zuverlĂ€ssiges Hosting fĂŒr Websites mit DDoS-Schutz und VPS-VDS-Servern đŸ”„ Kaufen Sie zuverlĂ€ssiges Webhosting mit DDoS-Schutz, VPS- und VDS-Server | ProHoster