Libros electrónicos y sus formatos: estamos hablando de EPUB - su historia, pros y contras

Anteriormente en el blog escribimos sobre cómo aparecieron los formatos de libros electrónicos. DjVu и FB2.

El tema del artículo de hoy es EPUB.

Libros electrónicos y sus formatos: estamos hablando de EPUB - su historia, pros y contras
Imagen: Natalia Oakley / CC POR

Historia del formato

En los años 90, el mercado de los libros electrónicos estaba dominado por soluciones patentadas. Y muchos fabricantes de lectores electrónicos tenían su propio formato. Por ejemplo, NuvoMedia utilizó archivos con la extensión .rb. Eran contenedores con un archivo HTML y un archivo .info que contenía metadatos. Esta situación complicó el trabajo de los editores: tuvieron que componer los libros para cada formato por separado. Un grupo de ingenieros de Microsoft, la ya mencionada NuvoMedia y SoftBook Press se comprometieron a corregir la situación.

En aquel momento, Microsoft iba a conquistar el mercado de los libros electrónicos y estaba desarrollando una aplicación de lectura electrónica para Windows 95. Podemos decir que la creación de un nuevo formato formaba parte de la estrategia empresarial del gigante informático.

Si hablamos de NuvoMedia, esta empresa es considerada el fabricante del primer lector electrónico masivo. Libro electrónico de cohetes. La memoria interna del dispositivo era de sólo ocho megabytes y la duración de la batería no superaba las 40 horas. En cuanto a SoftBook Press, también desarrollaron lectores electrónicos. Pero sus dispositivos tenían una característica distintiva: un módem incorporado que permitía descargar literatura digital directamente desde SoftBookstore.

A principios de la década de XNUMX, ambas empresas, NuvoMedia y SoftBook, fueron adquiridas por la empresa de medios Gemstar y fusionadas en Gemstar eBook Group. Esta organización continuó vendiendo lectores durante varios años (por ejemplo, RCA REB 1100) y libros digitales, sin embargo en 2003 Salió del negocio.

Pero volvamos al desarrollo de una norma única. En 1999, Microsoft, NuvoMedia y SoftBook Press fundaron el Open eBook Forum, que comenzó a trabajar en el borrador del documento que marcó el inicio de EPUB. Originalmente estándar fue llamado OEBPS (Significa Estructura Abierta de Publicación de Libros Electrónicos). Permitió distribuir una publicación digital en un solo archivo (archivo ZIP) y facilitó la transferencia de libros entre diferentes plataformas de hardware.

Posteriormente, las empresas de TI Adobe, IBM, HP, Nokia, Xerox y los editores McGraw Hill y Time Warner se unieron al Open eBook Forum. Juntos continuaron desarrollando la OEBPS y el ecosistema de literatura digital en su conjunto. En 2005, la organización pasó a llamarse Foro Internacional de Publicaciones Digitales, o IDPF.

En 2007, IDPF cambió el nombre del formato OEBPS a EPUB y comenzó a desarrollar su segunda versión. Fue presentado al público en general en 2010. Sin embargo, el nuevo producto casi no se diferenciaba de su predecesor. apoyo recibido gráficos vectoriales y fuentes integradas.

En ese momento, EPUB se estaba apoderando del mercado y se convirtió en el estándar predeterminado para muchos editores y fabricantes de dispositivos electrónicos. El formato ya era utilizado por O'Reilly y Cisco Press, además era compatible con dispositivos Apple, Sony, Barnes & Noble y ONYX BOOX.

En 2009, el proyecto Google Books объявил sobre soporte para EPUB: se ha utilizado para distribuir más de un millón de libros gratuitos. El formato empezó a ganar popularidad entre los escritores. En 2011, JK Rowling habló de planes lanzar el sitio web Pottermore y convertirlo en el único punto de venta de libros de Potter en formato digital.

Se eligió EPUB como estándar para distribuir literatura, principalmente debido a su capacidad para implementar protección contra copia (DRM). Todos los libros en la tienda online del escritor hasta el momento. solo disponible en este formato.

La tercera versión del formato EPUB se lanzó en 2011. Los desarrolladores han agregado la capacidad de trabajar con archivos de audio y video y notas al pie. Hoy en día, el estándar continúa evolucionando: en 2017 IDPF incluso entró parte del consorcio W3C, que implementa estándares tecnológicos para la World Wide Web.

Cómo funciona EPUB

Un libro en formato EPUB es un archivo ZIP. Almacena el texto de la publicación en forma de páginas XHTML o HTML o archivos PDF. El archivo también contiene contenido multimedia (audio, vídeo o imágenes), fuentes y metadatos. También puede contener archivos adicionales con estilos CSS o PLS-documentos con información para servicios de generación de voz.

El marcado XML es responsable de mostrar el contenido. Fragmento de un libro con audio e imagen incrustados. podría verse así:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html>
<html  
    
    epub_prefix="media: http://idpf.org/epub/vocab/media/#">
    <head>
        <meta charset="utf-8" />
        <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" />
    </head>
    <body>
        <section class="base">
            <h1>the entire transcript</h1>
            <audio id="bgsound" epub_type="media:soundtrack media:background"
                src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop="">
                <div class="errmsg">
                    <p>Your Reading System does not support (this) audio</p>
                </div>
            </audio>

            <p>What does it mean to be human if we don't have a shared culture? What
 does a shared culture mean if we can't share it? It's only in the last
 100, or 150 years or so, that we started tightly restricting how that
 culture gets used.</p>

            <img class="left" src="../images/326261902_3fa36f548d.jpg"
                alt="child against a wall" />
        </section>
    </body>
</html>

Además de los archivos de contenido, el archivo contiene un documento de navegación especial (Documento de navegación). Describe la disposición del texto y las imágenes en un libro. Las aplicaciones de lectura acceden a él si el lector quiere "saltar" varias páginas.

Otro archivo requerido en el archivo es el paquete. Incluye metadatos: información sobre el autor, editor, idioma, título, etc. También incluye una lista (lomo) de subsecciones del libro. Se puede ver un ejemplo de un documento de paquete. en el repositorio IDPF en GitHub.

Valor

La ventaja del formato es su flexibilidad. EPUB le permite crear un diseño de documento dinámico que se adapta al tamaño de la pantalla de su dispositivo. Esta es una de las principales razones por las que el formato es compatible con una gran cantidad de lectores (y otros dispositivos electrónicos). Por ejemplo, todos los lectores ONYX BOOX funcionan con EPUB desde el primer momento: desde el básico hasta el de 6 pulgadas. César 3 hasta premium y 9,7 pulgadas Euclides.

Libros electrónicos y sus formatos: estamos hablando de EPUB - su historia, pros y contras
/ BOOX DE ÓNIX César 3

Dado que el formato se basa en estándares populares (XML), es fácil de convertir para leer en Internet. EPUB también admite elementos interactivos. Sí, existen elementos similares en PDF, pero sólo puedes agregarlos a un documento PDF utilizando software propietario. En el caso de EPUB, se agregan al libro mediante etiquetas XML y etiquetas en cualquier editor de texto.

Otra ventaja de EPUB son sus características para personas con problemas de visión o dislexia. El estándar le permite modificar la visualización del texto en la pantalla; por ejemplo, resaltar ciertas combinaciones de letras.

EPUB, como ya hemos señalado, brinda al editor la oportunidad de instalar protección contra copia. Vendedores de libros electrónicos si lo desea puedo usar sus mecanismos limitan el acceso al documento. Para hacer esto, necesita modificar el archivo Rights.xml en el archivo.

Limitaciones

Para crear una publicación EPUB, debe comprender la sintaxis XML, XHTML y CSS. En este caso, deberá trabajar con una gran cantidad de identificadores. A modo de comparación, lo mismo estándar fb2 incluye sólo el conjunto mínimo de etiquetas requerido, suficiente para el diseño de la ficción. y para crear Documentos PDF No se requieren conocimientos especiales: el software especializado se encarga de todo.

EPUB también es criticado por la complejidad del diseño de cómics y otros libros con muchas ilustraciones. En este caso, el editor tiene que crear un diseño estático con coordenadas fijas para cada imagen; esto puede requerir mucho esfuerzo y tiempo.

¿Qué sigue

IDPF está trabajando actualmente en nuevas especificaciones para el formato. Por ejemplo, uno de ellos te ayudará a crear tutoriales interactivos. con secciones ocultas. El mismo libro se verá diferente para un profesor y un alumno; en el segundo caso, por ejemplo, se ocultarán las respuestas a los exámenes o las preguntas de control.

Libros electrónicos y sus formatos: estamos hablando de EPUB - su historia, pros y contras
Imagen: Guian Bolisay /CC BY-SA

Se espera que la nueva función ayude a reorganizar el proceso educativo. Hoy en día, las grandes universidades utilizan EPUB de forma bastante activa, por ejemplo la Universidad de Oxford. Hace unos años ellos adicional Soporte EPUB 3.0 en su aplicación de biblioteca digital.

IDPF también está creando una especificación para implementar notas al pie de anotación abierta en EPUB. Este estándar fue desarrollado por el W3C en 2013 y simplifica el trabajo con tipos complejos de anotaciones. Por ejemplo, puedes usarlo para agregar una nota a una sección específica de una imagen JPEG. Estándar opcional implementa el mecanismo sincronizar cambios en anotaciones entre copias del mismo documento EPUB. Abrir notas de formato de anotación Se pueden añadir en archivos EPUB incluso ahora, pero aún no se ha adoptado una especificación formal para ellos.

También se está trabajando en una nueva versión del estándar: EPUB 3.2. Contendrá formatos WOFF 2.0 и SFNT, que se utilizan para comprimir fuentes (en algunos casos pueden reducir el tamaño de los archivos en un 30%). Los desarrolladores también reemplazarán algunos atributos HTML obsoletos. Por ejemplo, en lugar de un elemento activador separado para activar archivos de audio y video, el nuevo estándar tendrá elementos de audio y video HTML nativos.

Borrador especificaciones и Lista de cambios ya están disponibles en el repositorio GitHub del W3C.

Reseñas de lectores electrónicos ONYX-BOOX:

Fuente: habr.com

Añadir un comentario