Libros electrónicos e os seus formatos: estamos a falar de EPUB: a súa historia, pros e contras

Anteriormente no blog escribimos sobre como apareceron os formatos de libros electrónicos Djvu и FB2.

O tema do artigo de hoxe é EPUB.

Libros electrónicos e os seus formatos: estamos a falar de EPUB: a súa historia, pros e contras
Imaxe: Nathan Oakley / CC BY

Historia do formato

Nos anos 90, o mercado dos libros electrónicos estaba dominado por solucións propietarias. E moitos fabricantes de lectores electrónicos tiñan o seu propio formato. Por exemplo, NuvoMedia utilizou ficheiros coa extensión .rb. Eran contedores cun ficheiro HTML e un ficheiro .info que contén metadatos. Este estado de cousas complicou o traballo das editoriais: tiñan que escribir libros por separado para cada formato. Un grupo de enxeñeiros de Microsoft, os xa mencionados NuvoMedia e SoftBook Press comprometéronse a corrixir a situación.

Nese momento, Microsoft ía conquistar o mercado dos libros electrónicos e estaba a desenvolver unha aplicación de lector electrónico para Windows 95. Podemos dicir que a creación dun novo formato formaba parte da estratexia comercial do xigante das TIC.

Se falamos de NuvoMedia, esta empresa considérase o fabricante do primeiro lector electrónico masivo Libro electrónico Rocket. A memoria interna do dispositivo era de só oito megabytes e a duración da batería non superaba as 40 horas. En canto a SoftBook Press, tamén desenvolveron lectores electrónicos. Pero os seus dispositivos tiñan unha característica distintiva -un módem incorporado- que permitía descargar literatura dixital directamente desde a SoftBookstore.

A principios da década de XNUMX, ambas empresas -NuvoMedia e SoftBook- foron compradas pola empresa de medios Gemstar e fusionáronse co Gemstar eBook Group. Esta organización continuou vendendo lectores durante varios anos (por exemplo, RCA REB 1100) e libros dixitais, pero en 2003 saíu do negocio.

Pero volvamos ao desenvolvemento dun único estándar. En 1999, Microsoft, NuvoMedia e SoftBook Press fundaron o Open eBook Forum, que comezou a traballar no borrador do documento que marcou o inicio de EPUB. Orixinalmente estándar chamouse OEBPS (siglas de Open EBook Publication Structure). Permitiu distribuír unha publicación dixital nun único ficheiro (arquivo ZIP) e facilitou a transferencia de libros entre distintas plataformas de hardware.

Máis tarde, as empresas de TI Adobe, IBM, HP, Nokia, Xerox e as editoriais McGraw Hill e Time Warner uníronse ao Open eBook Forum. Xuntos continuaron desenvolvendo OEBPS e desenvolvendo o ecosistema da literatura dixital no seu conxunto. En 2005, a organización pasou a chamarse Foro Internacional para a Edición Dixital, ou IDPF.

En 2007, IDPF cambiou o nome do formato OEBPS a EPUB e comezou a desenvolver a súa segunda versión. Foi presentado ao público en xeral en 2010. Non obstante, o novo produto case non era diferente do seu predecesor recibiu apoio gráficos vectoriais e fontes incorporadas.

Nese momento, EPUB estaba asumindo o mercado e converteuse no estándar predeterminado para moitos editores e fabricantes de gadgets electrónicos. O formato xa era utilizado por O'Reilly e Cisco Press, ademais de que era compatible con dispositivos Apple, Sony, Barnes & Noble e ONYX BOOX.

En 2009, o proxecto Google Books anunciou sobre o soporte para EPUB - utilizouse para distribuír máis dun millón de libros gratuítos. O formato comezou a gañar popularidade entre os escritores. En 2011, JK Rowling falou dos plans lanzar o sitio web de Pottermore e convertelo no único punto de venda de libros de Potter en formato dixital.

EPUB foi elixido como o estándar para a distribución de literatura, principalmente pola súa capacidade para implementar protección contra copia (DRM). Todos os libros da tenda en liña do escritor ata o momento só dispoñible neste formato.

A terceira versión do formato EPUB publicouse en 2011. Os desenvolvedores engadiron a posibilidade de traballar con ficheiros de audio e vídeo e notas ao pé. Hoxe o estándar segue evolucionando - en 2017 IDPF incluso entrou parte do consorcio W3C, que implementa estándares tecnolóxicos para a World Wide Web.

Como funciona EPUB

Un libro en formato EPUB é un arquivo ZIP. Almacena o texto da publicación en forma de páxinas XHTML ou HTML ou ficheiros PDF. O arquivo tamén contén contido multimedia (audio, vídeo ou imaxes), fontes e metadatos. Tamén pode conter ficheiros adicionais con estilos CSS ou pls-documentos con información para servizos de xeración de fala.

O marcado XML encárgase de mostrar o contido. Fragmento dun libro con audio e imaxe incrustados pode verse así:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html>
<html  
    
    epub_prefix="media: http://idpf.org/epub/vocab/media/#">
    <head>
        <meta charset="utf-8" />
        <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" />
    </head>
    <body>
        <section class="base">
            <h1>the entire transcript</h1>
            <audio id="bgsound" epub_type="media:soundtrack media:background"
                src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop="">
                <div class="errmsg">
                    <p>Your Reading System does not support (this) audio</p>
                </div>
            </audio>

            <p>What does it mean to be human if we don't have a shared culture? What
 does a shared culture mean if we can't share it? It's only in the last
 100, or 150 years or so, that we started tightly restricting how that
 culture gets used.</p>

            <img class="left" src="../images/326261902_3fa36f548d.jpg"
                alt="child against a wall" />
        </section>
    </body>
</html>

Ademais dos ficheiros de contido, o arquivo contén un documento de navegación especial (documento de navegación). Describe a disposición do texto e das imaxes nun libro. As aplicacións lectoras acceden a el se o lector quere "saltar" varias páxinas.

Outro ficheiro necesario no arquivo é package. Inclúe metadatos: información sobre o autor, a editorial, o idioma, o título, etc. Tamén inclúe unha lista (lombo) de subseccións do libro. Pódese ver un exemplo de documento de paquete no repositorio de IDPF en GitHub.

dignidade

A vantaxe do formato é a súa flexibilidade. EPUB permítelle crear un deseño de documento dinámico que se adapte ao tamaño da pantalla do dispositivo. Esta é unha das principais razóns polas que o formato é compatible con un gran número de lectores (e outros dispositivos electrónicos). Por exemplo, todos os lectores de ONYX BOOX funcionan con EPUB fóra da caixa: desde o básico e de 6 polgadas. César 3 ata premium e 9,7 polgadas Euclides.

Libros electrónicos e os seus formatos: estamos a falar de EPUB: a súa historia, pros e contras
/ ONYX BOOX Caesar 3

Dado que o formato está baseado en estándares populares (XML), é fácil de converter para ler en Internet. EPUB tamén admite elementos interactivos. Si, existen elementos similares en PDF, pero só podes engadilos a un documento PDF mediante un software propietario. No caso de EPUB, engádense ao libro mediante marcas e etiquetas XML en calquera editor de texto.

Outra vantaxe de EPUB son as súas características para persoas con problemas de visión ou dislexia. O estándar permítelle modificar a visualización do texto na pantalla, por exemplo, resaltar certas combinacións de letras.

EPUB, como xa sinalamos, dálle ao editor a oportunidade de instalar protección contra copia. Vendedores de libros electrónicos se o desexa pode usar os seus mecanismos que limitan o acceso ao documento. Para iso, cómpre modificar o ficheiro rights.xml do arquivo.

Limitacións

Para crear unha publicación EPUB, debes comprender a sintaxe XML, XHTML e CSS. Neste caso, tes que traballar cunha gran cantidade de identificadores. A modo de comparación, o mesmo Estándar FB2 inclúe só o conxunto mínimo necesario de etiquetas, suficiente para a disposición da ficción. E para crear Documentos PDF Non se require ningún coñecemento especial: o software especializado é o responsable de todo.

Tamén se critica a EPUB pola complexidade do deseño de cómics e outros libros con moitas ilustracións. Neste caso, o editor ten que crear un deseño estático con coordenadas fixas para cada imaxe; isto pode levar moito tempo e esforzo.

Que hai a continuación

IDPF está a traballar actualmente en novas especificacións para o formato. Por exemplo, un deles axudarache a crear titoriais interactivos con seccións ocultas. O mesmo libro terá un aspecto diferente para un profesor e un alumno; no segundo caso, por exemplo, ocultaranse as respostas a probas ou preguntas de control.

Libros electrónicos e os seus formatos: estamos a falar de EPUB: a súa historia, pros e contras
Imaxe: Guian Bolisay / CC BY-SA

Espérase que a nova función axude a reorganizar o proceso educativo. Hoxe en día, EPUB úsase bastante activamente polas grandes universidades, por exemplo a Universidade de Oxford. Hai uns anos eles engadido Compatibilidade con EPUB 3.0 na súa aplicación de biblioteca dixital.

IDPF tamén está a crear unha especificación para implementar notas ao pé de anotación aberta en EPUB. Este estándar foi desenvolvido polo W3C en 2013; simplifica o traballo con tipos complexos de anotacións. Por exemplo, pode usalo para engadir unha nota a unha sección específica dunha imaxe JPEG. Estándar opcional implementa o mecanismo sincronizando os cambios nas anotacións entre copias do mesmo documento EPUB. Abre Notas do formato de anotación pode engadir en ficheiros EPUB aínda agora, pero aínda non se adoptou unha especificación formal para eles.

Tamén se está a traballar nunha nova versión do estándar - EPUB 3.2. Conterá formatos WOFF 2.0 и SFNT, que se usan para comprimir fontes (nalgúns casos poden reducir o tamaño dos ficheiros nun 30%). Os desenvolvedores tamén substituirán algúns atributos HTML obsoletos. Por exemplo, en lugar dun elemento activador separado para activar ficheiros de audio e vídeo, o novo estándar terá elementos de audio e vídeo HTML nativos.

Borrador especificacións и Lista de cambios xa están dispoñibles no repositorio de GitHub do W3C.

Reseñas de lectores electrónicos ONYX-BOOX:

Fonte: www.habr.com

Engadir un comentario