電子書及其格式:我們正在談論 EPUB - 它的歷史、優點和缺點

在部落格的前面我們寫過電子書格式是如何出現的 傑武 и FB2.

今天文章的主題是EPUB。

電子書及其格式:我們正在談論 EPUB - 它的歷史、優點和缺點
圖片: 內森·奧克利 /抄送

格式的歷史

90 世紀 XNUMX 年代,電子書市場由專有解決方案主導。 許多電子閱讀器製造商都有自己的格式。 例如,NuvoMedia 使用副檔名為 .rb 的檔案。 這些是帶有 HTML 檔案和包含元資料的 .info 檔案的容器。 這種情況使出版商的工作變得複雜——他們必須為每種格式單獨排版書籍。 來自微軟、前面提到的 NuvoMedia 和 SoftBook Press 的一群工程師致力於糾正這種情況。

當時,微軟正準備征服電子書市場,正在為Windows 95開發電子閱讀器應用程式。可以說,創建新格式是這家IT巨頭商業策略的一部分。

如果我們談論 NuvoMedia,該公司被認為是第一台大眾電子閱讀器的製造商 火箭電子書。 該設備的記憶體只有40兆字節,電池續航力也不超過XNUMX小時。 至於SoftBook Press,他們也開發了電子閱讀器。 但他們的設備有一個獨特的功能 - 內建調製解調器 - 它允許您直接從 SoftBookstore 下載數位文學。

XNUMX 年代初,NuvoMedia 和 SoftBook 這兩家公司都被媒體公司 Gemstar 收購並併入 Gemstar 電子書集團。 該組織多年來持續銷售讀者(例如, RCA REB 1100)和數位圖書,但在 2003 年 破產了.

但讓我們回到單一標準的開發。 1999 年,Microsoft、NuvoMedia 和 SoftBook Press 成立了開放電子書論壇,該論壇開始起草標誌著 EPUB 誕生的文件草案。 原來是標準的 被稱為 OEBPS(開放電子書出版架構)。 它使得以單一檔案(ZIP 檔案)形式分發數位出版物成為可能,並使得在不同硬體平台之間傳輸書籍變得更加容易。

隨後,IT公司Adobe、IBM、惠普、諾基亞、施樂以及出版商McGraw Hill和時代華納加入了開放電子書論壇。 他們共同繼續開發 OEBPS 並開發整個數位文學生態系統。 2005年,該組織更名為國際數位出版論壇,或 IDPF.

2007年,IDPF將OEBPS格式更名為EPUB並開始開發第二個版本。 它於 2010 年向公眾展示。 然而,新產品與其前身幾乎沒有什麼不同 得到支持 向量圖形和內建字體。

此時,EPUB 已經佔領了市場,並成為許多出版商和電子產品製造商的預設標準。 該格式已被 O'Reilly 和 Cisco Press 使用,此外,Apple、Sony、Barnes & Noble 和 ONYX BOOX 設備也支援該格式。

2009年,Google圖書項目 объявил 關於對 EPUB 的支援 - 它已被用來分發超過一百萬本免費書籍。 這種格式開始受到作家的歡迎。 2011年,JK羅琳 講述了計劃 推出 Pottermore 網站,並使其成為波特圖書數位形式的唯一銷售點。

EPUB 被選為分發文獻的標準,主要是因為它能夠實現複製保護(DRM)。 到目前為止作者在線商店中的所有書籍 僅此格式可用.

EPUB 格式的第三個版本於 2011 年發布。 開發人員添加了處理音訊和視訊檔案以及腳註的功能。 如今,該標準仍在不斷發展 - 2017 年 IDPF 甚至進來了 W3C 聯盟的一部分,該聯盟實施萬維網技術標準。

EPUB 的工作原理

EPUB 格式的書籍是 ZIP 檔案。 它以 XHTML 或 HTML 頁面或 PDF 文件的形式儲存出版物的文字。 該存檔還包含媒體內容(音訊、視訊或圖像)、字體和元資料。 它還可能包含帶有 CSS 樣式的附加文件或 PLS-包含語音產生服務資訊的文件。

XML 標記負責顯示內容。 嵌入音訊和圖像的書籍片段 可能看起來像這樣:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html>
<html  
    
    epub_prefix="media: http://idpf.org/epub/vocab/media/#">
    <head>
        <meta charset="utf-8" />
        <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" />
    </head>
    <body>
        <section class="base">
            <h1>the entire transcript</h1>
            <audio id="bgsound" epub_type="media:soundtrack media:background"
                src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop="">
                <div class="errmsg">
                    <p>Your Reading System does not support (this) audio</p>
                </div>
            </audio>

            <p>What does it mean to be human if we don't have a shared culture? What
 does a shared culture mean if we can't share it? It's only in the last
 100, or 150 years or so, that we started tightly restricting how that
 culture gets used.</p>

            <img class="left" src="../images/326261902_3fa36f548d.jpg"
                alt="child against a wall" />
        </section>
    </body>
</html>

除了內容檔案之外,存檔還包含一個特殊的導航文件(Navigation Document)。 它描述了書中文字和圖像的排列。 如果讀者想要「跳過」多個頁面,則閱讀器應用程式可以存取它。

存檔中另一個必要的檔案是 package.json。 它包括元資料——有關作者、出版商、語言、標題等的資訊。 它也包括本書各小節的清單(書脊)。 可以查看包文檔的範例 在 GitHub 上的 IDPF 儲存庫中.

尊嚴

此格式的優點是其彈性。 EPUB 可讓您建立適應裝置螢幕尺寸的動態文件佈局。 這是該格式受到大量閱讀器(和其他電子設備)支援的主要原因之一。 例如,所有 ONYX BOOX 閱讀器均可直接使用 EPUB:從基本版到 6 英寸 凱撒3 最高可達高級版和 9,7 英寸 歐幾里德.

電子書及其格式:我們正在談論 EPUB - 它的歷史、優點和缺點
/ ONYX BOOX 凱撒 3

由於該格式基於流行標準 (XML),因此很容易轉換以供在 Internet 上閱讀。 EPUB 也支援互動元素。 是的,PDF 中存在類似的元素,但您只能使用專有軟體將它們新增至 PDF 文件中。 對於 EPUB,可以在任何文字編輯器中使用標記和 XML 標籤將它們新增至書中。

EPUB 的另一個優點是它適合有視力問題或閱讀障礙的人。 此標準可讓您修改螢幕上文字的顯示 - 例如,突出顯示某些字母組合。

正如我們已經指出的,EPUB 為出版商提供了安裝版權保護的機會。 電子書賣家(如果需要) 可以使用 他們的機制限制了對文件的存取。 為此,您需要修改存檔中的rights.xml 檔案。

限制

要建立 EPUB 出版物,您必須了解 XML、XHTML 和 CSS 語法。 在這種情況下,您必須使用大量標識符。 為了比較,同樣 FB2標準 僅包含所需的最少標籤集 - 足以滿足小說的佈局。 並創造 PDF文檔 根本不需要任何特殊知識——專門的軟體負責一切。

EPUB 也因漫畫和其他帶有大量插圖的書籍設計複雜而受到批評。 在這種情況下,發布商必須為每個影像建立具有固定座標的靜態佈局 - 這可能需要花費大量的精力和時間。

下一步是什麼

IDPF 目前正在製定該格式的新規格。 例如,其中之一將幫助您建立互動式教程 有隱藏部分。 同一本書看起來對教師和學生會有所不同 - 例如,在第二種情況下,測驗或控制問題的答案將被隱藏。

電子書及其格式:我們正在談論 EPUB - 它的歷史、優點和缺點
圖片: Guian Bolisay / CC BY-SA

預計新功能將有助於重組教育流程。 如今,EPUB 被牛津大學等大型大學廣泛使用。 幾年前他們 添加 數位圖書館應用程式中的 EPUB 3.0 支援。

IDPF 也正在建立在 EPUB 中實作開放註解註腳的規格。 該標準由 W3C 於 2013 年制定 - 它簡化了複雜類型註釋的處理。 例如,您可以使用它來為 JPEG 影像的特定部分新增註解。 可選標準 落實機制 同步同一 EPUB 文件副本之間註解的變更。 開啟註釋格式註釋 可以添加 即使現在也已進入 EPUB 文件,但尚未採用它們的正式規範。

該標準的新版本 - EPUB 3.2 的工作也在進行中。 它將包含格式 沃夫2.0 и SFNT,用於壓縮字體(在某些情況下,它們可以將檔案大小減少 30%)。 開發人員也會替換一些過時的 HTML 屬性。 例如,新標準將採用原生 HTML 音訊和視訊元素,而不是用於啟動音訊和視訊檔案的單獨觸發元素。

草案 規格 и 變更清單 已在 W3C GitHub 儲存庫中提供。

ONYX-BOOX電子閱讀器評論:

來源: www.habr.com

添加評論