Llibres electrònics i els seus formats: parlem d'EPUB: la seva història, avantatges i contres

Abans al blog vam escriure sobre com van aparèixer els formats de llibres electrònics Djvu и FB2.

El tema de l'article d'avui és EPUB.

Llibres electrònics i els seus formats: parlem d'EPUB: la seva història, avantatges i contres
Imatge: Nathan Oakley / CC BY

Història del format

Als anys 90, el mercat dels llibres electrònics estava dominat per solucions pròpies. I molts fabricants de lectors electrònics tenien el seu propi format. Per exemple, NuvoMedia va utilitzar fitxers amb l'extensió .rb. Es tractava de contenidors amb un fitxer HTML i un fitxer .info que contenia metadades. Aquest estat de coses complicava la feina de les editorials: havien de compondre llibres per separat per a cada format. Un grup d'enginyers de Microsoft, els ja esmentats NuvoMedia i SoftBook Press es van comprometre a corregir la situació.

En aquell moment, Microsoft anava a conquerir el mercat dels llibres electrònics i desenvolupava una aplicació de lector electrònic per a Windows 95. Podem dir que la creació d'un nou format formava part de l'estratègia empresarial del gegant informàtic.

Si parlem de NuvoMedia, aquesta empresa es considera el fabricant del primer lector electrònic massiu Llibre electrònic de coets. La memòria interna del dispositiu era de només vuit megabytes i la durada de la bateria no superava les 40 hores. Pel que fa a SoftBook Press, també van desenvolupar lectors electrònics. Però els seus dispositius tenien una característica distintiva: un mòdem integrat, que us permetia descarregar literatura digital directament des de la SoftBookstore.

A principis de la dècada del XNUMX, ambdues companyies -NuvoMedia i SoftBook- van ser comprades per l'empresa de mitjans Gemstar i es van fusionar amb Gemstar eBook Group. Aquesta organització va continuar venent lectors durant diversos anys (per exemple, RCA REB 1100) i llibres digitals, però el 2003 va sortir del negoci.

Però tornem al desenvolupament d'un únic estàndard. L'any 1999, Microsoft, NuvoMedia i SoftBook Press van fundar l'Open eBook Forum, que va començar a treballar en l'esborrany del document que va marcar l'inici de l'EPUB. Originalment estàndard es deia OEBPS (sigles de Open EBook Publication Structure). Va permetre distribuir una publicació digital en un sol fitxer (arxiu ZIP) i va facilitar la transferència de llibres entre diferents plataformes de maquinari.

Més tard, les empreses de TI Adobe, IBM, HP, Nokia, Xerox i els editors McGraw Hill i Time Warner es van unir a l'Open eBook Forum. Junts van continuar desenvolupant OEBPS i desenvolupant l'ecosistema de la literatura digital en el seu conjunt. L'any 2005, l'organització va passar a anomenar-se Fòrum Internacional per a l'edició digital, o IDPF.

El 2007, IDPF va canviar el nom del format OEBPS a EPUB i va començar a desenvolupar la seva segona versió. Es va presentar al públic en general l'any 2010. Tanmateix, el nou producte gairebé no era diferent del seu predecessor va rebre suport gràfics vectorials i tipus de lletra incorporats.

En aquest moment, EPUB estava agafant el mercat i es va convertir en l'estàndard predeterminat per a molts editors i fabricants de gadgets electrònics. El format ja el feien servir O'Reilly i Cisco Press, a més de comptar amb el suport dels dispositius Apple, Sony, Barnes & Noble i ONYX BOOX.

El 2009, el projecte Google Books va anunciar sobre el suport a EPUB: s'ha utilitzat per distribuir més d'un milió de llibres gratuïts. El format va començar a guanyar popularitat entre els escriptors. El 2011, JK Rowling parlava dels plans llançar el lloc web de Pottermore i convertir-lo en l'únic punt de venda de llibres de Potter en format digital.

EPUB va ser escollit com a estàndard per distribuir literatura, principalment per la seva capacitat per implementar protecció contra còpia (DRM). Tots els llibres de la botiga en línia de l'escriptor fins ara només disponible en aquest format.

La tercera versió del format EPUB es va publicar el 2011. Els desenvolupadors han afegit la possibilitat de treballar amb fitxers d'àudio i vídeo i notes al peu. Avui l'estàndard continua evolucionant: el 2017 IDPF fins i tot va entrar part del consorci W3C, que implementa estàndards tecnològics per a la World Wide Web.

Com funciona EPUB

Un llibre en format EPUB és un arxiu ZIP. Emmagatzema el text de la publicació en forma de pàgines XHTML o HTML o fitxers PDF. L'arxiu també conté contingut multimèdia (àudio, vídeo o imatges), tipus de lletra i metadades. També pot contenir fitxers addicionals amb estils CSS o PLS-documents amb informació per als serveis de generació de parla.

L'etiquetatge XML és responsable de mostrar el contingut. Fragment d'un llibre amb àudio i imatge incrustats podria semblar així:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html>
<html  
    
    epub_prefix="media: http://idpf.org/epub/vocab/media/#">
    <head>
        <meta charset="utf-8" />
        <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" />
    </head>
    <body>
        <section class="base">
            <h1>the entire transcript</h1>
            <audio id="bgsound" epub_type="media:soundtrack media:background"
                src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop="">
                <div class="errmsg">
                    <p>Your Reading System does not support (this) audio</p>
                </div>
            </audio>

            <p>What does it mean to be human if we don't have a shared culture? What
 does a shared culture mean if we can't share it? It's only in the last
 100, or 150 years or so, that we started tightly restricting how that
 culture gets used.</p>

            <img class="left" src="../images/326261902_3fa36f548d.jpg"
                alt="child against a wall" />
        </section>
    </body>
</html>

A més dels fitxers de contingut, l'arxiu conté un document de navegació especial (document de navegació). Descriu la disposició del text i les imatges en un llibre. Les aplicacions de lector hi accedeixen si el lector vol "saltar" diverses pàgines.

Un altre fitxer necessari a l'arxiu és package. Inclou metadades: informació sobre l'autor, l'editor, l'idioma, el títol, etc. També inclou una llista (el llom) de les subseccions del llibre. Es pot veure un exemple de document de paquet al repositori IDPF de GitHub.

dignitat

L'avantatge del format és la seva flexibilitat. EPUB us permet crear un disseny de document dinàmic que s'adapti a la mida de la pantalla del vostre dispositiu. Aquesta és una de les principals raons per les quals el format és compatible amb un gran nombre de lectors (i altres dispositius electrònics). Per exemple, tots els lectors d'ONYX BOOX funcionen amb EPUB fora de la caixa: de bàsic i de 6 polzades Cèsar 3 fins a premium i 9,7 polzades Euclides.

Llibres electrònics i els seus formats: parlem d'EPUB: la seva història, avantatges i contres
/ BOIXA D'ÒNIX Caesar 3

Com que el format es basa en estàndards populars (XML), és fàcil de convertir per llegir-lo a Internet. EPUB també admet elements interactius. Sí, hi ha elements similars en PDF, però només podeu afegir-los a un document PDF mitjançant programari propietari. En el cas de l'EPUB, s'afegeixen al llibre mitjançant etiquetes de marcatge i XML en qualsevol editor de text.

Un altre avantatge d'EPUB són les seves característiques per a persones amb problemes de visió o dislèxia. L'estàndard us permet modificar la visualització del text a la pantalla, per exemple, ressaltar determinades combinacions de lletres.

EPUB, com ja hem assenyalat, ofereix a l'editor l'oportunitat d'instal·lar protecció contra còpia. Venedors de llibres electrònics si ho desitja pot utilitzar els seus mecanismes que limiten l'accés al document. Per fer-ho, heu de modificar el fitxer rights.xml de l'arxiu.

Limitacions

Per crear una publicació EPUB, heu d'entendre la sintaxi XML, XHTML i CSS. En aquest cas, cal treballar amb un gran nombre d'identificadors. Per comparació, el mateix Estàndard FB2 inclou només el conjunt mínim d'etiquetes requerides, suficient per a la disposició de la ficció. I per crear Documents PDF No es requereix cap coneixement especial: el programari especialitzat és responsable de tot.

EPUB també és criticat per la complexitat del disseny de còmics i altres llibres amb moltes il·lustracions. En aquest cas, l'editor ha de crear un disseny estàtic amb coordenades fixes per a cada imatge; això pot requerir molt d'esforç i temps.

Què és el següent

IDPF està treballant actualment en noves especificacions per al format. Per exemple, un d'ells us ajudarà a crear tutorials interactius amb seccions ocultes. El mateix llibre tindrà un aspecte diferent per a un professor i un alumne; en el segon cas, per exemple, s'amagaran les respostes a les proves o preguntes de control.

Llibres electrònics i els seus formats: parlem d'EPUB: la seva història, avantatges i contres
Imatge: Guian Bolisay / CC BY-SA

Es preveu que la nova funció ajudi a reorganitzar el procés educatiu. Avui dia, EPUB s'utilitza força activament per grans universitats, per exemple, la Universitat d'Oxford. Fa uns anys ells afegit Suport EPUB 3.0 a la vostra aplicació de biblioteca digital.

IDPF també està creant una especificació per implementar notes al peu d'anotació oberta a EPUB. Aquest estàndard va ser desenvolupat pel W3C l'any 2013: simplifica el treball amb tipus complexos d'anotacions. Per exemple, podeu utilitzar-lo per afegir una nota a una secció específica d'una imatge JPEG. Estàndard opcional implementa el mecanisme sincronitzar els canvis en les anotacions entre còpies del mateix document EPUB. Obriu Notes de format d'anotació pot afegir en fitxers EPUB encara ara, però encara no s'ha adoptat una especificació formal per a ells.

També s'està treballant en una nova versió de l'estàndard: EPUB 3.2. Contindrà formats WOFF 2.0 и SFNT, que s'utilitzen per comprimir tipus de lletra (en alguns casos poden reduir la mida dels fitxers en un 30%). Els desenvolupadors també substituiran alguns atributs HTML obsolets. Per exemple, en lloc d'un element activador independent per activar fitxers d'àudio i vídeo, el nou estàndard tindrà elements d'àudio i vídeo HTML natius.

Esborrany especificacions и Llista de canvis ja estan disponibles al repositori GitHub del W3C.

Ressenyes dels lectors electrònics ONYX-BOOX:

Font: www.habr.com

Afegeix comentari