Livros eletrônicos e seus formatos: estamos falando de EPUB - sua história, prós e contras

Anteriormente no blog, escrevemos sobre como surgiram os formatos de e-book DjVu и FB2.

O tema do artigo de hoje é EPUB.

Livros eletrônicos e seus formatos: estamos falando de EPUB - sua história, prós e contras
Cenário: Nathan Oakley / CC POR

História do formato

Na década de 90, o mercado de e-books era dominado por soluções proprietárias. E muitos fabricantes de leitores eletrônicos tinham seu próprio formato. Por exemplo, a NuvoMedia usou arquivos com extensão .rb. Eram contêineres com um arquivo HTML e um arquivo .info contendo metadados. Esse estado de coisas complicou o trabalho dos editores - eles tiveram que compor os livros para cada formato separadamente. Um grupo de engenheiros da Microsoft, as já citadas NuvoMedia e SoftBook Press se comprometeram a corrigir a situação.

Naquela época, a Microsoft ia conquistar o mercado de e-books e desenvolvia um aplicativo de e-reader para Windows 95. Podemos dizer que a criação de um novo formato fazia parte da estratégia de negócios da gigante de TI.

Se falamos da NuvoMedia, esta empresa é considerada a fabricante do primeiro leitor eletrônico de massa Rocket e-book. A memória interna do aparelho era de apenas oito megabytes e a duração da bateria não ultrapassava 40 horas. Já a SoftBook Press também desenvolveu leitores eletrônicos. Mas seus dispositivos tinham uma característica distintiva - um modem embutido - que permitia baixar literatura digital diretamente da SoftBookstore.

No início dos anos XNUMX, ambas as empresas - NuvoMedia e SoftBook - foram adquiridas pela empresa de mídia Gemstar e fundidas no Gemstar eBook Group. Esta organização continuou a vender leitores durante vários anos (por exemplo, RCA REB 1100) e livros digitais, porém em 2003 saiu do negócio.

Mas voltemos ao desenvolvimento de um padrão único. Em 1999, Microsoft, NuvoMedia e SoftBook Press fundaram o Open eBook Forum, que começou a trabalhar no rascunho do documento que marcou o início do EPUB. Originalmente padrão foi chamado OEBPS (significa Estrutura de Publicação de E-book Aberto). Possibilitou a distribuição de uma publicação digital em um único arquivo (arquivo ZIP) e facilitou a transferência de livros entre diferentes plataformas de hardware.

Mais tarde, as empresas de TI Adobe, IBM, HP, Nokia, Xerox e as editoras McGraw Hill e Time Warner juntaram-se ao Open eBook Forum. Juntos, eles continuaram a desenvolver o OEBPS e a desenvolver o ecossistema da literatura digital como um todo. Em 2005, a organização foi renomeada como Fórum Internacional para Publicação Digital, ou IDPF.

Em 2007, o IDPF mudou o nome do formato OEBPS para EPUB e iniciou o desenvolvimento de sua segunda versão. Foi apresentado ao público em geral em 2010. O novo produto quase não era diferente do seu antecessor, no entanto recebeu apoio gráficos vetoriais e fontes integradas.

Nessa época, o EPUB estava dominando o mercado e se tornou o padrão para muitos editores e fabricantes de dispositivos eletrônicos. O formato já era usado pela O'Reilly e Cisco Press, além de ser suportado pelos dispositivos Apple, Sony, Barnes & Noble e ONYX BOOX.

Em 2009, o projeto Google Livros объявил sobre o suporte ao EPUB - ele já foi usado para distribuir mais de um milhão de livros gratuitos. O formato começou a ganhar popularidade entre os escritores. Em 2011, JK Rowling contou sobre planos lançar o site Pottermore e torná-lo o único ponto de venda de livros Potter em formato digital.

O EPUB foi escolhido como padrão para distribuição de literatura, principalmente devido à sua capacidade de implementar proteção contra cópia (DRM). Todos os livros da loja online do escritor até agora disponível apenas neste formato.

A terceira versão do formato EPUB foi lançada em 2011. Os desenvolvedores adicionaram a capacidade de trabalhar com arquivos de áudio e vídeo e notas de rodapé. Hoje o padrão continua a evoluir – em 2017 IDPF até entrou parte do consórcio W3C, que implementa padrões de tecnologia para a World Wide Web.

Como funciona o EPUB

Um livro no formato EPUB é um arquivo ZIP. Armazena o texto da publicação na forma de páginas XHTML ou HTML ou arquivos PDF. O arquivo também contém conteúdo de mídia (áudio, vídeo ou imagens), fontes e metadados. Também pode conter arquivos adicionais com estilos CSS ou PLS-documentos com informações para serviços de geração de fala.

A marcação XML é responsável pela exibição do conteúdo. Fragmento de um livro com áudio e imagem incorporados pode ser assim:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html>
<html  
    
    epub_prefix="media: http://idpf.org/epub/vocab/media/#">
    <head>
        <meta charset="utf-8" />
        <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" />
    </head>
    <body>
        <section class="base">
            <h1>the entire transcript</h1>
            <audio id="bgsound" epub_type="media:soundtrack media:background"
                src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop="">
                <div class="errmsg">
                    <p>Your Reading System does not support (this) audio</p>
                </div>
            </audio>

            <p>What does it mean to be human if we don't have a shared culture? What
 does a shared culture mean if we can't share it? It's only in the last
 100, or 150 years or so, that we started tightly restricting how that
 culture gets used.</p>

            <img class="left" src="../images/326261902_3fa36f548d.jpg"
                alt="child against a wall" />
        </section>
    </body>
</html>

Além dos arquivos de conteúdo, o arquivo contém um documento de navegação especial (Documento de Navegação). Descreve a organização de texto e imagens em um livro. Os aplicativos de leitura acessam-no se o leitor quiser “pular” várias páginas.

Outro arquivo necessário no arquivo é o package. Inclui metadados – informações sobre o autor, editora, idioma, título e assim por diante. Também inclui uma lista (lombada) de subseções do livro. Um exemplo de documento de pacote pode ser visualizado no repositório IDPF no GitHub.

Valor

A vantagem do formato é a sua flexibilidade. EPUB permite criar um layout de documento dinâmico que se adapta ao tamanho da tela do seu dispositivo. Esta é uma das principais razões pelas quais o formato é suportado por um grande número de leitores (e outros dispositivos eletrônicos). Por exemplo, todos os leitores ONYX BOOX funcionam com EPUB prontos para uso: do básico ao de 6 polegadas César 3 até premium e 9,7 polegadas Euclides.

Livros eletrônicos e seus formatos: estamos falando de EPUB - sua história, prós e contras
/ ÔNIX BOOX César 3

Como o formato é baseado em padrões populares (XML), é fácil convertê-lo para leitura na Internet. EPUB também oferece suporte a elementos interativos. Sim, existem elementos semelhantes em PDF, mas você só pode adicioná-los a um documento PDF usando software proprietário. No caso do EPUB, eles são adicionados ao livro por meio de marcação e tags XML em qualquer editor de texto.

Outra vantagem do EPUB são suas funcionalidades para pessoas com problemas de visão ou dislexia. O padrão permite modificar a exibição do texto na tela - por exemplo, destacar certas combinações de letras.

O EPUB, como já observamos, dá ao editor a oportunidade de instalar proteção contra cópia. Vendedores de e-books, se desejar pode usar seus mecanismos que limitam o acesso ao documento. Para fazer isso, você precisa modificar o arquivo Rights.xml no arquivo.

Contras:

Para criar uma publicação EPUB, você deve compreender a sintaxe XML, XHTML e CSS. Neste caso, você terá que trabalhar com um grande número de identificadores. Para efeito de comparação, o mesmo Padrão FB2 inclui apenas o conjunto mínimo de tags necessário - suficiente para o layout da ficção. E para criar Documentos PDF Nenhum conhecimento especial é necessário - um software especializado é responsável por tudo.

O EPUB também é criticado pela complexidade do design de quadrinhos e outros livros com muitas ilustrações. Nesse caso, o editor deve criar um layout estático com coordenadas fixas para cada imagem – isso pode exigir muito esforço e tempo.

Qual é o próximo

Atualmente, o IDPF está trabalhando em novas especificações para o formato. Por exemplo, um deles irá ajudá-lo a criar tutoriais interativos com seções ocultas. O mesmo livro terá uma aparência diferente para um professor e um aluno - no segundo caso, por exemplo, as respostas de testes ou questões de controle ficarão ocultas.

Livros eletrônicos e seus formatos: estamos falando de EPUB - sua história, prós e contras
Cenário: Guian Bolisay / CC BY-SA

Espera-se que a nova função ajude a reorganizar o processo educacional. Hoje, o EPUB é usado ativamente por grandes universidades, por exemplo, a Universidade de Oxford. Há alguns anos eles adicionado Suporte EPUB 3.0 em seu aplicativo de biblioteca digital.

O IDPF também está criando uma especificação para implementar notas de rodapé de anotação aberta em EPUB. Este padrão foi desenvolvido pelo W3C em 2013 e simplifica o trabalho com tipos complexos de anotações. Por exemplo, você pode usá-lo para adicionar uma nota a uma seção específica de uma imagem JPEG. Padrão opcional implementa o mecanismo sincronizar alterações nas anotações entre cópias do mesmo documento EPUB. Abrir notas de formato de anotação pode adicionar em arquivos EPUB até agora, mas uma especificação formal para eles ainda não foi adotada.

Também estão em andamento trabalhos em uma nova versão do padrão - EPUB 3.2. Ele conterá formatos WOFF 2.0 и SFNT, que são usados ​​para compactar fontes (em alguns casos, podem reduzir o tamanho dos arquivos em 30%). Os desenvolvedores também substituirão alguns atributos HTML desatualizados. Por exemplo, em vez de um elemento de gatilho separado para ativar arquivos de áudio e vídeo, o novo padrão terá elementos de áudio e vídeo HTML nativos.

Rascunho especificações и Lista de mudanças já estão disponíveis no repositório GitHub do W3C.

Avaliações de leitores eletrônicos ONYX-BOOX:

Fonte: habr.com

Adicionar um comentário