Elektronische Bücher und ihre Formate: Die Rede ist von EPUB – seiner Geschichte, Vor- und Nachteilen

Zu Beginn des Blogs haben wir darüber geschrieben, wie E-Book-Formate entstanden sind DjVu и FB2.

Das Thema des heutigen Artikels ist EPUB.

Elektronische Bücher und ihre Formate: Die Rede ist von EPUB – seiner Geschichte, Vor- und Nachteilen
Bild: Nathan Oakley / CC BY

Geschichte des Formats

In den 90er Jahren wurde der E-Book-Markt von proprietären Lösungen dominiert. Und viele E-Reader-Hersteller hatten ihr eigenes Format. NuvoMedia verwendete beispielsweise Dateien mit der Erweiterung .rb. Dabei handelte es sich um Container mit einer HTML-Datei und einer .info-Datei mit Metadaten. Dieser Sachverhalt erschwerte die Arbeit der Verlage – sie mussten Bücher für jedes Format separat setzen. Eine Gruppe von Ingenieuren von Microsoft, der bereits erwähnten NuvoMedia und SoftBook Press hat es sich zur Aufgabe gemacht, die Situation zu korrigieren.

Damals wollte Microsoft den E-Book-Markt erobern und entwickelte eine E-Reader-Anwendung für Windows 95. Man kann sagen, dass die Schaffung eines neuen Formats Teil der Geschäftsstrategie des IT-Riesen war.

Wenn wir über NuvoMedia sprechen, gilt dieses Unternehmen als Hersteller des ersten elektronischen Massenlesegeräts Raketen-eBook. Der interne Speicher des Geräts betrug nur acht Megabyte und die Akkulaufzeit betrug nicht mehr als 40 Stunden. SoftBook Press entwickelte auch elektronische Lesegeräte. Ihre Geräte verfügten jedoch über eine Besonderheit – ein eingebautes Modem –, mit dem Sie digitale Literatur direkt aus dem SoftBookstore herunterladen konnten.

Anfang der XNUMXer Jahre wurden beide Unternehmen – NuvoMedia und SoftBook – vom Medienunternehmen Gemstar aufgekauft und zur Gemstar eBook Group verschmolzen. Diese Organisation verkaufte mehrere Jahre lang weiterhin Leser (z. B. RCA REB 1100) und digitale Bücher, jedoch im Jahr 2003 gab das Geschäft auf.

Aber kehren wir zur Entwicklung eines einzigen Standards zurück. Im Jahr 1999 gründeten Microsoft, NuvoMedia und SoftBook Press das Open eBook Forum, das mit der Arbeit an dem Dokumententwurf begann, der den Beginn von EPUB markierte. Ursprünglich Standard wurde gerufen OEBPS (steht für Open EBook Publication Structure). Es ermöglichte die Verteilung einer digitalen Publikation in einer einzigen Datei (ZIP-Archiv) und erleichterte die Übertragung von Büchern zwischen verschiedenen Hardwareplattformen.

Später schlossen sich die IT-Unternehmen Adobe, IBM, HP, Nokia, Xerox sowie die Verlage McGraw Hill und Time Warner dem Open eBook Forum an. Gemeinsam entwickelten sie OEBPS weiter und entwickelten das Ökosystem der digitalen Literatur als Ganzes. Im Jahr 2005 wurde die Organisation in International Forum for Digital Publishing umbenannt IDPF.

Im Jahr 2007 änderte IDPF den Namen des OEBPS-Formats in EPUB und begann mit der Entwicklung seiner zweiten Version. Im Jahr 2010 wurde es der Öffentlichkeit vorgestellt. Das neue Produkt unterschied sich jedoch kaum von seinem Vorgänger Unterstützung erhalten Vektorgrafiken und integrierte Schriftarten.

Zu diesem Zeitpunkt eroberte EPUB den Markt und wurde zum Standardstandard für viele Verlage und Hersteller elektronischer Geräte. Das Format wurde bereits von O'Reilly und Cisco Press verwendet und außerdem von Apple-, Sony-, Barnes & Noble- und ONYX BOOX-Geräten unterstützt.

Im Jahr 2009 startete das Google Books-Projekt объявил über die Unterstützung von EPUB – es wurde verwendet, um mehr als eine Million kostenlose Bücher zu verteilen. Das Format begann bei Autoren immer beliebter zu werden. Im Jahr 2011, JK Rowling erzählte von Plänen Starten Sie die Pottermore-Website und machen Sie sie zur einzigen Verkaufsstelle für Potter-Bücher in digitaler Form.

EPUB wurde als Standard für die Verbreitung von Literatur ausgewählt, vor allem wegen seiner Fähigkeit, einen Kopierschutz zu implementieren (DRM). Alle Bücher bisher im Online-Shop des Autors nur in diesem Format verfügbar.

Die dritte Version des EPUB-Formats wurde 2011 veröffentlicht. Die Entwickler haben die Möglichkeit hinzugefügt, mit Audio- und Videodateien sowie Fußnoten zu arbeiten. Heute entwickelt sich der Standard weiter – im Jahr 2017 IDPF kam sogar rein Teil des W3C-Konsortiums, das Technologiestandards für das World Wide Web implementiert.

So funktioniert EPUB

Ein Buch im EPUB-Format ist ein ZIP-Archiv. Es speichert den Text der Publikation in Form von XHTML- oder HTML-Seiten oder PDF-Dateien. Das Archiv enthält außerdem Medieninhalte (Audio, Video oder Bilder), Schriftarten und Metadaten. Es kann auch zusätzliche Dateien mit CSS-Stilen oder enthalten PLS-Dokumente mit Informationen für Sprachgenerierungsdienste.

XML-Markup ist für die Anzeige von Inhalten verantwortlich. Fragment eines Buches mit eingebettetem Audio und Bild könnte so aussehen:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html>
<html  
    
    epub_prefix="media: http://idpf.org/epub/vocab/media/#">
    <head>
        <meta charset="utf-8" />
        <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" />
    </head>
    <body>
        <section class="base">
            <h1>the entire transcript</h1>
            <audio id="bgsound" epub_type="media:soundtrack media:background"
                src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop="">
                <div class="errmsg">
                    <p>Your Reading System does not support (this) audio</p>
                </div>
            </audio>

            <p>What does it mean to be human if we don't have a shared culture? What
 does a shared culture mean if we can't share it? It's only in the last
 100, or 150 years or so, that we started tightly restricting how that
 culture gets used.</p>

            <img class="left" src="../images/326261902_3fa36f548d.jpg"
                alt="child against a wall" />
        </section>
    </body>
</html>

Zusätzlich zu den Inhaltsdateien enthält das Archiv ein spezielles Navigationsdokument (Navigationsdokument). Es beschreibt die Anordnung von Text und Bildern in einem Buch. Leseranwendungen greifen darauf zu, wenn der Leser mehrere Seiten „überspringen“ möchte.

Eine weitere erforderliche Datei im Archiv ist package. Es enthält Metadaten – Informationen über den Autor, den Herausgeber, die Sprache, den Titel usw. Es enthält auch eine Liste (Rücken) der Unterabschnitte des Buches. Ein Beispiel für ein Paketdokument kann angezeigt werden im IDPF-Repository auf GitHub.

Wert

Der Vorteil des Formats ist seine Flexibilität. Mit EPUB können Sie ein dynamisches Dokumentlayout erstellen, das sich an die Größe des Bildschirms Ihres Geräts anpasst. Dies ist einer der Hauptgründe, warum das Format von einer großen Anzahl von Lesegeräten (und anderen elektronischen Geräten) unterstützt wird. Beispielsweise funktionieren alle ONYX BOOX-Reader sofort mit EPUB: von Basic bis 6 Zoll Caesar 3 bis Premium und 9,7 Zoll Euklid.

Elektronische Bücher und ihre Formate: Die Rede ist von EPUB – seiner Geschichte, Vor- und Nachteilen
/ ONYX-BOX Caesar 3

Da das Format auf gängigen Standards (XML) basiert, lässt es sich leicht zum Lesen im Internet konvertieren. EPUB unterstützt auch interaktive Elemente. Ja, es gibt ähnliche Elemente in PDF, aber Sie können sie nur mit proprietärer Software zu einem PDF-Dokument hinzufügen. Im Falle von EPUB werden sie mithilfe von Markup- und XML-Tags in einem beliebigen Texteditor zum Buch hinzugefügt.

Ein weiterer Vorteil von EPUB sind seine Funktionen für Menschen mit Sehproblemen oder Legasthenie. Mit dem Standard können Sie die Anzeige von Text auf dem Bildschirm ändern – beispielsweise bestimmte Buchstabenkombinationen hervorheben.

Wie bereits erwähnt, bietet EPUB dem Verlag die Möglichkeit, einen Kopierschutz zu installieren. E-Book-Verkäufer auf Wunsch Kann benutzen ihre Mechanismen beschränken den Zugriff auf das Dokument. Dazu müssen Sie die Datei Rights.xml im Archiv ändern.

Begrenztheit

Um eine EPUB-Publikation zu erstellen, müssen Sie die XML-, XHTML- und CSS-Syntax verstehen. In diesem Fall muss mit einer großen Anzahl von Identifikatoren gearbeitet werden. Zum Vergleich: das Gleiche FB2-Standard Enthält nur den minimal erforderlichen Satz an Tags – ausreichend für das Layout von Belletristik. Und zu erschaffen PDF-Dokumente Es sind keinerlei besondere Kenntnisse erforderlich – für alles ist eine spezielle Software verantwortlich.

Kritisiert wird EPUB auch wegen der Komplexität der Gestaltung von Comics und anderen Büchern mit vielen Illustrationen. In diesem Fall muss der Verlag für jedes Bild ein statisches Layout mit festen Koordinaten erstellen – das kann viel Aufwand und Zeit kosten.

Was weiter

IDPF arbeitet derzeit an neuen Spezifikationen für das Format. Eine davon hilft Ihnen beispielsweise bei der Erstellung interaktiver Tutorials mit versteckten Abschnitten. Das gleiche Buch sieht für einen Lehrer und einen Schüler unterschiedlich aus – im zweiten Fall werden beispielsweise Antworten auf Tests oder Kontrollfragen ausgeblendet.

Elektronische Bücher und ihre Formate: Die Rede ist von EPUB – seiner Geschichte, Vor- und Nachteilen
Bild: Guian Bolisay / CC BY-SA

Es wird erwartet, dass die neue Funktion dazu beitragen wird, den Bildungsprozess neu zu organisieren. Heutzutage wird EPUB von großen Universitäten, beispielsweise der University of Oxford, recht aktiv genutzt. Vor ein paar Jahren sie hinzugefügt EPUB 3.0-Unterstützung in Ihrer digitalen Bibliotheksanwendung.

IDPF erstellt außerdem eine Spezifikation für die Implementierung von Open Annotation-Fußnoten in EPUB. Dieser Standard wurde 3 vom W2013C entwickelt – er vereinfacht die Arbeit mit komplexen Annotationstypen. Sie können damit beispielsweise eine Notiz zu einem bestimmten Abschnitt eines JPEG-Bilds hinzufügen. Optionaler Standard implementiert den Mechanismus Synchronisieren von Anmerkungsänderungen zwischen Kopien desselben EPUB-Dokuments. Öffnen Sie Notizen im Anmerkungsformat Sie können hinzufügen können bereits jetzt in EPUB-Dateien umgewandelt werden, eine formelle Spezifikation dafür wurde jedoch noch nicht verabschiedet.

Außerdem wird an einer neuen Version des Standards gearbeitet – EPUB 3.2. Es wird Formate enthalten WAF 2.0 и SFNT, die zum Komprimieren von Schriftarten verwendet werden (in einigen Fällen können sie die Dateigröße um 30 % reduzieren). Außerdem werden die Entwickler einige veraltete HTML-Attribute ersetzen. Anstelle eines separaten Triggerelements zum Aktivieren von Audio- und Videodateien wird der neue Standard beispielsweise über native HTML-Audio- und Videoelemente verfügen.

Entwurf Spezifikationen и Liste der Änderungen sind bereits im W3C GitHub-Repository verfügbar.

Rezensionen zu ONYX-BOOX E-Readern:

Source: habr.com

Kommentar hinzufügen