电子书及其格式:我们正在谈论 EPUB - 它的历史、优点和缺点

在博客的前面我们写过电子书格式是如何出现的 的DjVu и FB2.

今天文章的主题是EPUB。

电子书及其格式:我们正在谈论 EPUB - 它的历史、优点和缺点
图片: 内森·奥克利 /抄送

格式的历史

90 世纪 XNUMX 年代,电子书市场由专有解决方案主导。 许多电子阅读器制造商都有自己的格式。 例如,NuvoMedia 使用扩展名为 .rb 的文件。 这些是带有 HTML 文件和包含元数据的 .info 文件的容器。 这种情况使出版商的工作变得复杂——他们必须为每种格式单独排版书籍。 来自微软、前面提到的 NuvoMedia 和 SoftBook Press 的一组工程师致力于纠正这种情况。

当时,微软正准备征服电子书市场,正在为Windows 95开发电子阅读器应用程序。可以说,创建新格式是这家IT巨头商业战略的一部分。

如果我们谈论 NuvoMedia,该公司被认为是第一台大众电子阅读器的制造商 火箭电子书。 该设备的内存只有40兆字节,电池续航时间也不超过XNUMX小时。 至于SoftBook Press,他们也开发了电子阅读器。 但他们的设备有一个独特的功能 - 内置调制解调器 - 它允许您直接从 SoftBookstore 下载数字文学。

XNUMX 年代初,NuvoMedia 和 SoftBook 这两家公司均被媒体公司 Gemstar 收购并并入 Gemstar 电子书集团。 该组织多年来持续销售读者(例如, RCA REB 1100)和数字图书,但是在 2003 年 破产了.

但让我们回到单一标准的开发。 1999 年,Microsoft、NuvoMedia 和 SoftBook Press 成立了开放电子书论坛,该论坛开始起草标志着 EPUB 诞生的文档草案。 原来是标准的 被叫了 OEBPS(开放电子书出版结构)。 它使得以单个文件(ZIP 存档)形式分发数字出版物成为可能,并使得在不同硬件平台之间传输图书变得更加容易。

随后,IT公司Adobe、IBM、惠普、诺基亚、施乐以及出版商McGraw Hill和时代华纳加入了开放电子书论坛。 他们共同继续开发 OEBPS 并开发整个数字文学生态系统。 2005年,该组织更名为国际数字出版论坛,或 IDPF.

2007年,IDPF将OEBPS格式更名为EPUB并开始开发第二个版本。 它于 2010 年向公众展示。 然而,新产品与其前身几乎没有什么不同 得到支持 矢量图形和内置字体。

此时,EPUB 已经占领了市场,并成为许多出版商和电子产品制造商的默认标准。 该格式已被 O'Reilly 和 Cisco Press 使用,此外,Apple、Sony、Barnes & Noble 和 ONYX BOOX 设备也支持该格式。

2009年,谷歌图书项目 объявил 关于对 EPUB 的支持 - 它已被用来分发超过一百万本免费书籍。 这种格式开始受到作家的欢迎。 2011年,JK罗琳 讲述了计划 推出 Pottermore 网站,并使其成为波特图书数字形式的唯一销售点。

EPUB 被选为分发文献的标准,主要是因为它能够实现复制保护(DRM)。 到目前为止作者在线商店中的所有书籍 仅此格式可用.

EPUB 格式的第三个版本于 2011 年发布。 开发人员添加了处理音频和视频文件以及脚注的功能。 如今,该标准仍在不断发展 - 2017 年 IDPF 甚至进来了 W3C 联盟的一部分,该联盟实施万维网技术标准。

EPUB 的工作原理

EPUB 格式的书籍是 ZIP 存档。 它以 XHTML 或 HTML 页面或 PDF 文件的形式存储出版物的文本。 该存档还包含媒体内容(音频、视频或图像)、字体和元数据。 它还可能包含带有 CSS 样式的附加文件或 PLS-包含语音生成服务信息的文档。

XML 标记负责显示内容。 嵌入音频和图像的书籍片段 可能看起来像这样:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html>
<html  
    
    epub_prefix="media: http://idpf.org/epub/vocab/media/#">
    <head>
        <meta charset="utf-8" />
        <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" />
    </head>
    <body>
        <section class="base">
            <h1>the entire transcript</h1>
            <audio id="bgsound" epub_type="media:soundtrack media:background"
                src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop="">
                <div class="errmsg">
                    <p>Your Reading System does not support (this) audio</p>
                </div>
            </audio>

            <p>What does it mean to be human if we don't have a shared culture? What
 does a shared culture mean if we can't share it? It's only in the last
 100, or 150 years or so, that we started tightly restricting how that
 culture gets used.</p>

            <img class="left" src="../images/326261902_3fa36f548d.jpg"
                alt="child against a wall" />
        </section>
    </body>
</html>

除了内容文件之外,存档还包含一个特殊的导航文档(Navigation Document)。 它描述了书中文本和图像的排列。 如果读者想要“跳过”多个页面,则阅读器应用程序可以访问它。

存档中另一个必需的文件是 package.json。 它包括元数据——有关作者、出版商、语言、标题等的信息。 它还包括本书各小节的列表(书脊)。 可以查看包文档的示例 在 GitHub 上的 IDPF 存储库中.

尊严

该格式的优点是其灵活性。 EPUB 允许您创建适应设备屏幕尺寸的动态文档布局。 这是该格式受到大量阅读器(和其他电子设备)支持的主要原因之一。 例如,所有 ONYX BOOX 阅读器均可直接使用 EPUB:从基本版到 6 英寸版 凯撒3 最高可达高级版和 9,7 英寸 欧几里德.

电子书及其格式:我们正在谈论 EPUB - 它的历史、优点和缺点
/ ONYX BOOX 凯撒 3

由于该格式基于流行标准 (XML),因此很容易转换以供在 Internet 上阅读。 EPUB 还支持交互元素。 是的,PDF 中存在类似的元素,但您只能使用专有软件将它们添加到 PDF 文档中。 对于 EPUB,可以在任何文本编辑器中使用标记和 XML 标签将它们添加到书中。

EPUB 的另一个优点是它适合有视力问题或阅读障碍的人。 该标准允许您修改屏幕上文本的显示 - 例如,突出显示某些字母组合。

正如我们已经指出的,EPUB 为出版商提供了安装版权保护的机会。 电子书卖家(如果需要) 可以使用 他们的机制限制了对文档的访问。 为此,您需要修改存档中的rights.xml 文件。

限制

要创建 EPUB 出版物,您必须了解 XML、XHTML 和 CSS 语法。 在这种情况下,您必须使用大量标识符。 为了比较,同样 FB2标准 仅包含所需的最少标签集 - 足以满足小说的布局。 并创造 PDF文档 根本不需要任何特殊知识——专门的软件负责一切。

EPUB 还因漫画和其他带有大量插图的书籍设计复杂而受到批评。 在这种情况下,发布商必须为每个图像创建具有固定坐标的静态布局 - 这可能需要花费大量的精力和时间。

接下来是什么

IDPF 目前正在制定该格式的新规范。 例如,其中之一将帮助您创建交互式教程 有隐藏部分。 同一本书对于教师和学生来说看起来会有所不同 - 例如,在第二种情况下,测试或控制问题的答案将被隐藏。

电子书及其格式:我们正在谈论 EPUB - 它的历史、优点和缺点
图片: Guian Bolisay / CC BY-SA

预计新功能将有助于重组教育流程。 如今,EPUB 被牛津大学等大型大学广泛使用。 几年前他们 添加 数字图书馆应用程序中的 EPUB 3.0 支持。

IDPF 还正在创建在 EPUB 中实施开放注释脚注的规范。 该标准由 W3C 于 2013 年制定 - 它简化了复杂类型注释的处理。 例如,您可以使用它向 JPEG 图像的特定部分添加注释。 可选标准 落实机制 同步同一 EPUB 文档副本之间注释的更改。 打开注释格式注释 您可以添加 即使现在也已进入 EPUB 文件,但尚未采用它们的正式规范。

该标准的新版本 - EPUB 3.2 的工作也在进行中。 它将包含格式 沃夫2.0 и SFNT,用于压缩字体(在某些情况下,它们可以将文件大小减少 30%)。 开发人员还将替换一些过时的 HTML 属性。 例如,新标准将采用原生 HTML 音频和视频元素,而不是用于激活音频和视频文件的单独触发元素。

草案 规格 и 变更清单 已在 W3C GitHub 存储库中提供。

ONYX-BOOX电子阅读器评论:

来源: habr.com

添加评论