Elektroniske bøger og deres formater: vi taler om EPUB - dens historie, fordele og ulemper

Tidligere på bloggen skrev vi om, hvordan e-bogsformater fremstod DjVu и FB2.

Emnet for dagens artikel er EPUB.

Elektroniske bøger og deres formater: vi taler om EPUB - dens historie, fordele og ulemper
Billede: Nathan Oakley / CC BY

Formatets historie

I 90'erne var e-bogsmarkedet domineret af proprietære løsninger. Og mange e-læserproducenter havde deres eget format. For eksempel brugte NuvoMedia filer med filtypenavnet .rb. Det var containere med en HTML-fil og en .info-fil indeholdende metadata. Denne situation komplicerede forlagenes arbejde - de skulle sætte bøger for hvert format separat. En gruppe ingeniører fra Microsoft, det allerede nævnte NuvoMedia og SoftBook Press påtog sig at rette op på situationen.

På det tidspunkt skulle Microsoft erobre e-bogsmarkedet og udviklede en e-reader-applikation til Windows 95. Vi kan sige, at oprettelsen af ​​et nyt format var en del af IT-gigantens forretningsstrategi.

Hvis vi taler om NuvoMedia, betragtes dette firma som producenten af ​​den første elektroniske masselæser Rocket e-bog. Enhedens interne hukommelse var kun otte megabyte, og batterilevetiden oversteg ikke 40 timer. Hvad angår SoftBook Press, udviklede de også elektroniske læsere. Men deres enheder havde et særpræg - et indbygget modem - det gav dig mulighed for at downloade digital litteratur direkte fra SoftBookstore.

I begyndelsen af ​​XNUMX'erne blev begge virksomheder - NuvoMedia og SoftBook - købt af medievirksomheden Gemstar og fusioneret ind i Gemstar eBook Group. Denne organisation fortsatte med at sælge læsere i flere år (f.eks. RCA REB 1100) og digitale bøger, dog i 2003 gik konkurs.

Men lad os vende tilbage til udviklingen af ​​en enkelt standard. I 1999 grundlagde Microsoft, NuvoMedia og SoftBook Press Open eBook Forum, som begyndte at arbejde på udkastet til dokument, der markerede begyndelsen på EPUB. Oprindeligt standard hedder OEBPS (står for Open EBook Publication Structure). Det gjorde det muligt at distribuere en digital publikation i en enkelt fil (ZIP-arkiv) og gjorde det nemmere at overføre bøger mellem forskellige hardwareplatforme.

Senere sluttede it-virksomhederne Adobe, IBM, HP, Nokia, Xerox og udgiverne McGraw Hill og Time Warner sig til Open eBook Forum. Sammen fortsatte de med at udvikle OEBPS og udvikle det digitale litteraturøkosystem som helhed. I 2005 blev organisationen omdøbt til International Forum for Digital Publishing, eller IDPF.

I 2007 ændrede IDPF navnet på OEBPS-formatet til EPUB og begyndte at udvikle dets anden version. Den blev præsenteret for offentligheden i 2010. Det nye produkt var dog næsten ikke anderledes end dets forgænger modtaget støtte vektorgrafik og indbyggede skrifttyper.

På dette tidspunkt var EPUB ved at overtage markedet og blev standardstandarden for mange udgivere og producenter af elektroniske gadgets. Formatet blev allerede brugt af O'Reilly og Cisco Press, plus det blev understøttet af Apple, Sony, Barnes & Noble og ONYX BOOX-enheder.

I 2009, Google Books-projektet объявил om support til EPUB - den er blevet brugt til at distribuere mere end en million gratis bøger. Formatet begyndte at vinde popularitet blandt forfattere. I 2011, JK Rowling fortalte om planer lancere Pottermore-webstedet og gøre det til det eneste salgssted for Potter-bøger i digital form.

EPUB blev valgt som standard for distribution af litteratur, primært på grund af dets evne til at implementere kopibeskyttelse (DRM). Alle bøger i forfatterens netbutik indtil videre kun tilgængelig i dette format.

Den tredje version af EPUB-formatet blev udgivet i 2011. Udviklerne har tilføjet muligheden for at arbejde med lyd- og videofiler og fodnoter. I dag fortsætter standarden med at udvikle sig - i 2017 IDPF kom selv ind del af W3C-konsortiet, som implementerer teknologistandarder for World Wide Web.

Sådan fungerer EPUB

En bog i EPUB-format er et ZIP-arkiv. Den gemmer publikationens tekst i form af XHTML- eller HTML-sider eller PDF-filer. Arkivet indeholder også medieindhold (lyd, video eller billeder), skrifttyper og metadata. Det kan også indeholde yderligere filer med CSS-stile eller PLS-dokumenter med information til talegenereringstjenester.

XML-markup er ansvarlig for at vise indhold. Fragment af en bog med indlejret lyd og billede kan se sådan ud:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html>
<html  
    
    epub_prefix="media: http://idpf.org/epub/vocab/media/#">
    <head>
        <meta charset="utf-8" />
        <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" />
    </head>
    <body>
        <section class="base">
            <h1>the entire transcript</h1>
            <audio id="bgsound" epub_type="media:soundtrack media:background"
                src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop="">
                <div class="errmsg">
                    <p>Your Reading System does not support (this) audio</p>
                </div>
            </audio>

            <p>What does it mean to be human if we don't have a shared culture? What
 does a shared culture mean if we can't share it? It's only in the last
 100, or 150 years or so, that we started tightly restricting how that
 culture gets used.</p>

            <img class="left" src="../images/326261902_3fa36f548d.jpg"
                alt="child against a wall" />
        </section>
    </body>
</html>

Ud over indholdsfilerne indeholder arkivet et særligt navigationsdokument (Navigationsdokument). Den beskriver opstillingen af ​​tekst og billeder i en bog. Læserapplikationer får adgang til det, hvis læseren ønsker at "springe" over flere sider.

En anden nødvendig fil i arkivet er pakke. Det inkluderer metadata - oplysninger om forfatteren, udgiveren, sproget, titel og så videre. Den indeholder også en liste (ryggen) over underafsnit af bogen. Et eksempel på et pakkedokument kan ses i IDPF-lageret på GitHub.

værdighed

Fordelen ved formatet er dets fleksibilitet. EPUB giver dig mulighed for at skabe dynamisk dokumentlayout, der tilpasser sig størrelsen på din enheds skærm. Dette er en af ​​hovedårsagerne til, at formatet understøttes af et stort antal læsere (og andre elektroniske enheder). For eksempel arbejder alle ONYX BOOX-læsere med EPUB ud af æsken: fra basic og 6-tommer Caesar 3 op til premium og 9,7 tommer Euclid.

Elektroniske bøger og deres formater: vi taler om EPUB - dens historie, fordele og ulemper
/ ONYX BOOX Cæsar 3

Da formatet er baseret på populære standarder (XML), er det nemt at konvertere til læsning på internettet. EPUB understøtter også interaktive elementer. Ja, lignende elementer findes i PDF, men du kan kun tilføje dem til et PDF-dokument ved hjælp af proprietær software. I tilfælde af EPUB føjes de til bogen ved hjælp af markup og XML-tags i enhver teksteditor.

En anden fordel ved EPUB er dens funktioner til personer med synsproblemer eller ordblindhed. Standarden giver dig mulighed for at ændre visningen af ​​tekst på skærmen - for eksempel fremhæve bestemte bogstavkombinationer.

EPUB, som vi allerede har bemærket, giver udgiveren mulighed for at installere kopibeskyttelse. E-bogssælgere hvis det ønskes kan bruge deres mekanismer, der begrænser adgangen til dokumentet. For at gøre dette skal du ændre filen rights.xml i arkivet.

Begrænsninger

For at oprette en EPUB-publikation skal du forstå XML-, XHTML- og CSS-syntaks. I dette tilfælde skal du arbejde med et stort antal identifikatorer. Til sammenligning, det samme FB2 standard omfatter kun det mindste krævede sæt tags - tilstrækkeligt til fiktionens layout. Og at skabe PDF-dokumenter Der kræves ingen særlig viden overhovedet - specialiseret software er ansvarlig for alt.

EPUB er også kritiseret for kompleksiteten i designet af tegneserier og andre bøger med mange illustrationer. I dette tilfælde skal udgiveren lave et statisk layout med faste koordinater for hvert billede - det kan tage mange kræfter og tid.

Hvad er næste

IDPF arbejder i øjeblikket på nye specifikationer for formatet. For eksempel vil en af ​​dem hjælpe dig med at oprette interaktive selvstudier med skjulte sektioner. Den samme bog vil se anderledes ud for en lærer og en elev – i det andet tilfælde vil for eksempel svar på test eller kontrolspørgsmål blive skjult.

Elektroniske bøger og deres formater: vi taler om EPUB - dens historie, fordele og ulemper
Billede: Guian Bolisay / CC BY-SA

Det forventes, at den nye funktion vil være med til at reorganisere uddannelsesforløbet. I dag bruges EPUB ret aktivt af store universiteter, for eksempel University of Oxford. For nogle år siden de tilføjet EPUB 3.0-understøttelse i din digitale biblioteksapplikation.

IDPF opretter også en specifikation til implementering af Open Annotation-fodnoter i EPUB. Denne standard blev udviklet af W3C i 2013 - den forenkler arbejdet med komplekse typer annoteringer. Du kan f.eks. bruge den til at tilføje en note til en bestemt sektion af et JPEG-billede. Valgfri standard implementerer mekanismen synkronisering af ændringer i annoteringer mellem kopier af det samme EPUB-dokument. Åbn Annotation Format Notes kan tilføjes i EPUB-filer selv nu, men en formel specifikation for dem er endnu ikke vedtaget.

Der arbejdes også på en ny version af standarden - EPUB 3.2. Det vil indeholde formater WOFF 2.0 и SFNT, som bruges til at komprimere skrifttyper (i nogle tilfælde kan de reducere filstørrelser med 30%). Udviklerne vil også erstatte nogle forældede HTML-attributter. For eksempel, i stedet for et separat triggerelement til aktivering af lyd- og videofiler, vil den nye standard have native HTML-lyd- og videoelementer.

Udkast specifikationer и Liste over ændringer er allerede tilgængelige i W3C GitHub-lageret.

Anmeldelser af ONYX-BOOX e-læsere:

Kilde: www.habr.com

Tilføj en kommentar