Elektroniske bøker og deres formater: vi snakker om EPUB - dens historie, fordeler og ulemper

Tidligere i bloggen skrev vi om hvordan e-bokformater dukket opp DjVu и FB2.

Temaet for dagens artikkel er EPUB.

Elektroniske bøker og deres formater: vi snakker om EPUB - dens historie, fordeler og ulemper
Bilde: Nathan Oakley / CC BY

Historien om formatet

På 90-tallet var e-bokmarkedet dominert av proprietære løsninger. Og mange e-leserprodusenter hadde sitt eget format. For eksempel brukte NuvoMedia filer med filtypen .rb. Dette var containere med en HTML-fil og en .info-fil som inneholdt metadata. Denne tilstanden kompliserte arbeidet til forlagene - de måtte sette bøker for hvert format separat. En gruppe ingeniører fra Microsoft, allerede nevnte NuvoMedia og SoftBook Press påtok seg å rette opp situasjonen.

På det tidspunktet skulle Microsoft erobre e-bokmarkedet og utviklet en e-leserapplikasjon for Windows 95. Vi kan si at etableringen av et nytt format var en del av IT-gigantens forretningsstrategi.

Hvis vi snakker om NuvoMedia, regnes dette selskapet som produsenten av den første elektroniske masseleseren Rocket eBok. Det interne minnet til enheten var bare åtte megabyte, og batterilevetiden oversteg ikke 40 timer. Når det gjelder SoftBook Press, utviklet de også elektroniske lesere. Men enhetene deres hadde en særegen funksjon - et innebygd modem - det tillot deg å laste ned digital litteratur direkte fra SoftBookstore.

På begynnelsen av XNUMX-tallet ble begge selskapene – NuvoMedia og SoftBook – kjøpt av medieselskapet Gemstar og fusjonert inn i Gemstar eBook Group. Denne organisasjonen fortsatte å selge lesere i flere år (f.eks. RCA REB 1100) og digitale bøker, men i 2003 gikk ut av virksomheten.

Men la oss gå tilbake til utviklingen av en enkelt standard. I 1999 grunnla Microsoft, NuvoMedia og SoftBook Press Open eBook Forum, som begynte å jobbe med utkastet til dokumentet som markerte begynnelsen på EPUB. Opprinnelig standard kalt OEBPS (står for Open EBook Publication Structure). Det gjorde det mulig å distribuere en digital publikasjon i én enkelt fil (ZIP-arkiv) og gjorde det enklere å overføre bøker mellom ulike maskinvareplattformer.

Senere ble IT-selskapene Adobe, IBM, HP, Nokia, Xerox og utgiverne McGraw Hill og Time Warner med i Open eBook Forum. Sammen fortsatte de å utvikle OEBPS og utvikle det digitale litteraturøkosystemet som helhet. I 2005 ble organisasjonen omdøpt til International Forum for Digital Publishing, eller IDPF.

I 2007 endret IDPF navnet på OEBPS-formatet til EPUB og begynte å utvikle sin andre versjon. Den ble presentert for allmennheten i 2010. Det nye produktet var imidlertid nesten ikke forskjellig fra forgjengeren fikk støtte vektorgrafikk og innebygde fonter.

På dette tidspunktet tok EPUB over markedet og ble standardstandarden for mange utgivere og produsenter av elektroniske gadgets. Formatet ble allerede brukt av O'Reilly og Cisco Press, pluss at det ble støttet av Apple-, Sony-, Barnes & Noble- og ONYX BOOX-enheter.

I 2009, Google Books-prosjektet kunngjort om EPUB-støtte - den har blitt brukt til å distribuere mer enn en million gratis bøker. Formatet begynte å få popularitet blant forfattere. I 2011, JK Rowling fortalte om planene lanser Pottermore-nettstedet og gjør det til det eneste salgsstedet for Potter-bøker i digital form.

EPUB ble valgt som standard for distribusjon av litteratur, først og fremst på grunn av dens evne til å implementere kopibeskyttelse (DRM). Alle bøker i forfatterens nettbutikk så langt kun tilgjengelig i dette formatet.

Den tredje versjonen av EPUB-formatet ble utgitt i 2011. Utviklerne har lagt til muligheten til å jobbe med lyd- og videofiler og fotnoter. I dag fortsetter standarden å utvikle seg - i 2017 IDPF kom til og med inn del av W3C-konsortiet, som implementerer teknologistandarder for World Wide Web.

Hvordan EPUB fungerer

En bok i EPUB-format er et ZIP-arkiv. Den lagrer teksten til publikasjonen i form av XHTML- eller HTML-sider eller PDF-filer. Arkivet inneholder også medieinnhold (lyd, video eller bilder), fonter og metadata. Den kan også inneholde flere filer med CSS-stiler eller PLS-dokumenter med informasjon for talegenereringstjenester.

XML-markering er ansvarlig for å vise innhold. Fragment av en bok med innebygd lyd og bilde kan se slik ut:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html>
<html  
    
    epub_prefix="media: http://idpf.org/epub/vocab/media/#">
    <head>
        <meta charset="utf-8" />
        <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" />
    </head>
    <body>
        <section class="base">
            <h1>the entire transcript</h1>
            <audio id="bgsound" epub_type="media:soundtrack media:background"
                src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop="">
                <div class="errmsg">
                    <p>Your Reading System does not support (this) audio</p>
                </div>
            </audio>

            <p>What does it mean to be human if we don't have a shared culture? What
 does a shared culture mean if we can't share it? It's only in the last
 100, or 150 years or so, that we started tightly restricting how that
 culture gets used.</p>

            <img class="left" src="../images/326261902_3fa36f548d.jpg"
                alt="child against a wall" />
        </section>
    </body>
</html>

I tillegg til innholdsfilene inneholder arkivet et spesielt navigasjonsdokument (Navigasjonsdokument). Den beskriver arrangementet av tekst og bilder i en bok. Leserapplikasjoner får tilgang til den hvis leseren ønsker å "hoppe over" flere sider.

En annen nødvendig fil i arkivet er pakke. Det inkluderer metadata – informasjon om forfatteren, utgiveren, språket, tittelen og så videre. Den inkluderer også en liste (ryggraden) over underavsnitt av boken. Et eksempel på et pakkedokument kan sees i IDPF-depotet på GitHub.

verdighet

Fordelen med formatet er dets fleksibilitet. EPUB lar deg lage dynamisk dokumentoppsett som tilpasser seg størrelsen på enhetens skjerm. Dette er en av hovedgrunnene til at formatet støttes av et stort antall lesere (og andre elektroniske enheter). For eksempel fungerer alle ONYX BOOX-lesere med EPUB ut av esken: fra basic og 6-tommers Cæsar 3 opptil premium og 9,7-tommers Euclid.

Elektroniske bøker og deres formater: vi snakker om EPUB - dens historie, fordeler og ulemper
/ ONYX BOOX Cæsar 3

Siden formatet er basert på populære standarder (XML), er det enkelt å konvertere for lesing på Internett. EPUB støtter også interaktive elementer. Ja, lignende elementer finnes i PDF, men du kan bare legge dem til et PDF-dokument ved å bruke proprietær programvare. Når det gjelder EPUB, legges de til boken ved hjelp av markup og XML-koder i et hvilket som helst tekstredigeringsprogram.

En annen fordel med EPUB er funksjonene for personer med synsproblemer eller dysleksi. Standarden lar deg endre visningen av tekst på skjermen - for eksempel markere visse bokstavkombinasjoner.

EPUB, som vi allerede har bemerket, gir utgiveren muligheten til å installere kopibeskyttelse. E-bok selgere om ønskelig kan bruke deres mekanismer som begrenser tilgangen til dokumentet. For å gjøre dette må du endre rights.xml-filen i arkivet.

Begrensninger

For å lage en EPUB-publikasjon må du forstå XML-, XHTML- og CSS-syntaks. I dette tilfellet må du jobbe med et stort antall identifikatorer. Til sammenligning, det samme FB2 standard inkluderer bare det minste nødvendige settet med tagger - tilstrekkelig for oppsettet av fiksjon. Og å skape PDF-dokumenter Det kreves ingen spesiell kunnskap i det hele tatt - spesialisert programvare er ansvarlig for alt.

EPUB er også kritisert for kompleksiteten i utformingen av tegneserier og andre bøker med mange illustrasjoner. I dette tilfellet må utgiveren lage en statisk layout med faste koordinater for hvert bilde – dette kan ta mye krefter og tid.

Hva er neste

IDPF jobber for tiden med nye spesifikasjoner for formatet. For eksempel vil en av dem hjelpe deg med å lage interaktive opplæringsprogrammer med skjulte deler. Den samme boken vil se annerledes ut for en lærer og en elev - i det andre tilfellet vil for eksempel svar på tester eller kontrollspørsmål være skjult.

Elektroniske bøker og deres formater: vi snakker om EPUB - dens historie, fordeler og ulemper
Bilde: Guian Bolisay / CC BY-SA

Det forventes at den nye funksjonen vil bidra til å omorganisere utdanningsløpet. I dag brukes EPUB ganske aktivt av store universiteter, for eksempel University of Oxford. For noen år siden de la til EPUB 3.0-støtte i din digitale bibliotekapplikasjon.

IDPF lager også en spesifikasjon for implementering av Open Annotation-fotnoter i EPUB. Denne standarden ble utviklet av W3C i 2013 – den forenkler arbeidet med komplekse typer merknader. Du kan for eksempel bruke den til å legge til et notat til en bestemt del av et JPEG-bilde. Valgfri standard implementerer mekanismen synkronisering av endringer i merknader mellom kopier av det samme EPUB-dokumentet. Åpne merknadsformatnotater kan legge til inn i EPUB-filer selv nå, men en formell spesifikasjon for dem er ennå ikke vedtatt.

Det jobbes også med en ny versjon av standarden – EPUB 3.2. Den vil inneholde formater WOFF 2.0 и SFNT, som brukes til å komprimere skrifter (i noen tilfeller kan de redusere filstørrelser med 30%). Utviklerne vil også erstatte noen utdaterte HTML-attributter. For eksempel, i stedet for et eget triggerelement for å aktivere lyd- og videofiler, vil den nye standarden ha innebygde HTML-lyd- og videoelementer.

Utkast spesifikasjoner и Liste over endringer er allerede tilgjengelig i W3C GitHub-depotet.

Anmeldelser av ONYX-BOOX e-lesere:

Kilde: www.habr.com

Legg til en kommentar