Elektronische boeken en hun formaten: we hebben het over EPUB - zijn geschiedenis, voor- en nadelen

Eerder in de blog schreven we over hoe e-bookformaten verschenen DjVu и FB2.

Het onderwerp van het artikel van vandaag is EPUB.

Elektronische boeken en hun formaten: we hebben het over EPUB - zijn geschiedenis, voor- en nadelen
Foto: Nathan Oakley / CC DOOR

Geschiedenis van het formaat

In de jaren negentig werd de e-bookmarkt gedomineerd door eigen oplossingen. En veel e-readerfabrikanten hadden hun eigen formaat. NuvoMedia gebruikte bijvoorbeeld bestanden met de extensie .rb. Dit waren containers met een HTML-bestand en een .info-bestand met metadata. Deze stand van zaken bemoeilijkte het werk van uitgevers: ze moesten boeken voor elk formaat afzonderlijk zetten. Een groep ingenieurs van Microsoft, de reeds genoemde NuvoMedia en SoftBook Press, beloofde de situatie te corrigeren.

Microsoft was op dat moment bezig de e-bookmarkt te veroveren en was bezig met de ontwikkeling van een e-readerapplicatie voor Windows 95. We kunnen zeggen dat het creëren van een nieuw formaat onderdeel was van de bedrijfsstrategie van de IT-gigant.

Als we het over NuvoMedia hebben, wordt dit bedrijf beschouwd als de fabrikant van de eerste massale elektronische lezer Raket eBook. Het interne geheugen van het apparaat was slechts acht megabytes en de batterijduur was niet langer dan 40 uur. Wat SoftBook Press betreft, ze ontwikkelden ook elektronische lezers. Maar hun apparaten hadden een onderscheidend kenmerk: een ingebouwde modem, waardoor je digitale literatuur rechtstreeks vanuit de SoftBookstore kon downloaden.

Begin jaren XNUMX werden beide bedrijven - NuvoMedia en SoftBook - gekocht door het mediabedrijf Gemstar en samengevoegd tot de Gemstar eBook Group. Deze organisatie bleef jarenlang lezers verkopen (bijvoorbeeld RCA-REB 1100) en digitale boeken, echter in 2003 is ermee gestopt.

Maar laten we terugkeren naar de ontwikkeling van één enkele standaard. In 1999 richtten Microsoft, NuvoMedia en SoftBook Press het Open eBook Forum op, dat begon te werken aan het conceptdocument dat het begin van EPUB markeerde. Oorspronkelijk standaard genaamd OEBPS (staat voor Open EBook Publication Structure). Het maakte het mogelijk om een ​​digitale publicatie in één bestand (ZIP-archief) te distribueren en maakte het gemakkelijker om boeken tussen verschillende hardwareplatforms over te zetten.

Later sloten IT-bedrijven Adobe, IBM, HP, Nokia, Xerox en uitgevers McGraw Hill en Time Warner zich aan bij het Open eBook Forum. Samen bleven ze OEBPS ontwikkelen en het digitale literatuur-ecosysteem als geheel ontwikkelen. In 2005 werd de organisatie omgedoopt tot het International Forum for Digital Publishing, oftewel IDPF.

In 2007 veranderde IDPF de naam van het OEBPS-formaat in EPUB en begon met de ontwikkeling van de tweede versie. In 2010 werd het aan het grote publiek gepresenteerd. Het nieuwe product verschilde echter vrijwel niet van zijn voorganger steun gekregen vectorafbeeldingen en ingebouwde lettertypen.

Tegen die tijd nam EPUB de markt over en werd het de standaardstandaard voor veel uitgevers en fabrikanten van elektronische gadgets. Het formaat werd al gebruikt door O'Reilly en Cisco Press, en werd ondersteund door Apple-, Sony-, Barnes & Noble- en ONYX BOOX-apparaten.

In 2009 startte het Google Books-project объявил over EPUB-ondersteuning - het is gebruikt om meer dan een miljoen gratis boeken te verspreiden. Het formaat begon aan populariteit te winnen onder schrijvers. In 2011, JK Rowling verteld over plannen de Pottermore-website lanceren en er het enige verkooppunt van Potter-boeken in digitale vorm van maken.

EPUB werd gekozen als standaard voor het verspreiden van literatuur, voornamelijk vanwege de mogelijkheid om kopieerbeveiliging te implementeren (DRM). Alle boeken tot nu toe in de online winkel van de schrijver alleen beschikbaar in dit formaat.

De derde versie van het EPUB-formaat werd uitgebracht in 2011. De ontwikkelaars hebben de mogelijkheid toegevoegd om met audio- en videobestanden en voetnoten te werken. Tegenwoordig blijft de standaard evolueren - in 2017 IDPF kwam zelfs binnen onderdeel van het W3C-consortium, dat technologiestandaarden voor het World Wide Web implementeert.

Hoe EPUB werkt

Een boek in EPUB-formaat is een ZIP-archief. Het slaat de tekst van de publicatie op in de vorm van XHTML- of HTML-pagina's of PDF-bestanden. Het archief bevat ook media-inhoud (audio, video of afbeeldingen), lettertypen en metadata. Het kan ook extra bestanden bevatten met CSS-stijlen of PLS-documenten met informatie voor diensten voor spraakgeneratie.

XML-opmaak is verantwoordelijk voor het weergeven van inhoud. Fragment van een boek met ingesloten audio en beeld zou er zo uit kunnen zien:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html>
<html  
    
    epub_prefix="media: http://idpf.org/epub/vocab/media/#">
    <head>
        <meta charset="utf-8" />
        <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" />
    </head>
    <body>
        <section class="base">
            <h1>the entire transcript</h1>
            <audio id="bgsound" epub_type="media:soundtrack media:background"
                src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop="">
                <div class="errmsg">
                    <p>Your Reading System does not support (this) audio</p>
                </div>
            </audio>

            <p>What does it mean to be human if we don't have a shared culture? What
 does a shared culture mean if we can't share it? It's only in the last
 100, or 150 years or so, that we started tightly restricting how that
 culture gets used.</p>

            <img class="left" src="../images/326261902_3fa36f548d.jpg"
                alt="child against a wall" />
        </section>
    </body>
</html>

Naast de inhoudsbestanden bevat het archief een speciaal navigatiedocument (Navigatiedocument). Het beschrijft de rangschikking van tekst en afbeeldingen in een boek. Lezertoepassingen hebben er toegang toe als de lezer meerdere pagina's wil 'overslaan'.

Een ander vereist bestand in het archief is package. Het bevat metadata: informatie over de auteur, uitgever, taal, titel, enzovoort. Het bevat ook een lijst (ruggengraat) met subsecties van het boek. U kunt een voorbeeld van een pakketdocument bekijken in de IDPF-repository op GitHub.

waardigheid

Het voordeel van het formaat is de flexibiliteit. Met EPUB kunt u een dynamische documentlay-out creëren die zich aanpast aan de grootte van uw apparaatscherm. Dit is een van de belangrijkste redenen waarom het formaat wordt ondersteund door een groot aantal lezers (en andere elektronische apparaten). Zo werken alle ONYX BOOX-lezers out-of-the-box met EPUB: van basic tot 6-inch caesar 3 tot premium en 9,7 inch Euclid.

Elektronische boeken en hun formaten: we hebben het over EPUB - zijn geschiedenis, voor- en nadelen
/ ONYX BOOX Caesar 3

Omdat het formaat is gebaseerd op populaire standaarden (XML), is het eenvoudig te converteren voor lezen op internet. EPUB ondersteunt ook interactieve elementen. Ja, soortgelijke elementen bestaan ​​in PDF, maar u kunt deze alleen met eigen software aan een PDF-document toevoegen. In het geval van EPUB worden ze in elke teksteditor aan het boek toegevoegd met behulp van opmaak- en XML-tags.

Een ander voordeel van EPUB zijn de mogelijkheden voor mensen met gezichtsproblemen of dyslexie. Met de standaard kunt u de weergave van tekst op het scherm wijzigen, bijvoorbeeld door bepaalde lettercombinaties te markeren.

EPUB geeft, zoals we al hebben opgemerkt, de uitgever de mogelijkheid om kopieerbeveiliging te installeren. E-boekverkopers indien gewenst kan gebruiken hun mechanismen die de toegang tot het document beperken. Om dit te doen, moet u het rights.xml-bestand in het archief wijzigen.

Beperkingen

Om een ​​EPUB-publicatie te maken, moet u de syntaxis van XML, XHTML en CSS begrijpen. In dit geval moet je met een groot aantal identifiers werken. Ter vergelijking: hetzelfde FB2-standaard bevat alleen de minimaal vereiste set tags - voldoende voor de opmaak van fictie. En om te creëren PDF-documenten Er is helemaal geen speciale kennis vereist: gespecialiseerde software is voor alles verantwoordelijk.

EPUB wordt ook bekritiseerd vanwege de complexiteit van het ontwerp van strips en andere boeken met veel illustraties. In dit geval moet de uitgever voor elke afbeelding een statische lay-out maken met vaste coördinaten - dit kan veel moeite en tijd kosten.

What's Next

IDPF werkt momenteel aan nieuwe specificaties voor het formaat. Een daarvan helpt u bijvoorbeeld bij het maken van interactieve tutorials met verborgen secties. Hetzelfde boek zal er voor een leraar en een leerling anders uitzien - in het tweede geval worden antwoorden op toetsen of controlevragen bijvoorbeeld verborgen.

Elektronische boeken en hun formaten: we hebben het over EPUB - zijn geschiedenis, voor- en nadelen
Foto: Guian Bolisay / CC BY-SA

De verwachting is dat de nieuwe functie zal helpen bij het reorganiseren van het onderwijsproces. Tegenwoordig wordt EPUB vrij actief gebruikt door grote universiteiten, bijvoorbeeld de Universiteit van Oxford. Een paar jaar geleden zij toegevoegd EPUB 3.0-ondersteuning in uw digitale bibliotheektoepassing.

IDPF maakt ook een specificatie voor het implementeren van Open Annotation-voetnoten in EPUB. Deze standaard is in 3 door het W2013C ontwikkeld en vereenvoudigt het werken met complexe soorten annotaties. U kunt het bijvoorbeeld gebruiken om een ​​notitie toe te voegen aan een specifiek gedeelte van een JPEG-afbeelding. Optioneel standaard implementeert het mechanisme het synchroniseren van wijzigingen in annotaties tussen exemplaren van hetzelfde EPUB-document. Open Annotatie-indelingsnotities kan toegevoegd worden zelfs nu nog in EPUB-bestanden, maar er is nog geen formele specificatie voor aangenomen.

Er wordt ook gewerkt aan een nieuwe versie van de standaard: EPUB 3.2. Het zal formaten bevatten WOFF 2.0 и SFNT, die worden gebruikt om lettertypen te comprimeren (in sommige gevallen kunnen ze de bestandsgrootte met 30% verkleinen). De ontwikkelaars zullen ook enkele verouderde HTML-attributen vervangen. In plaats van een apart triggerelement voor het activeren van audio- en videobestanden zal de nieuwe standaard bijvoorbeeld native HTML-audio- en video-elementen bevatten.

Droogte specificaties и Lijst met wijzigingen zijn al beschikbaar in de W3C GitHub-repository.

Beoordelingen van ONYX-BOOX e-readers:

Bron: www.habr.com

Voeg een reactie