Электронныя кнігі і іх фарматы: гаворым пра EPUB — яго гісторыю, плюсы і мінусы

Раней у блогу мы пісалі аб тым, як з'явіліся фарматы электронных кніг DjVu и FB2.

Тэма сённяшняга артыкула – EPUB.

Электронныя кнігі і іх фарматы: гаворым пра EPUB — яго гісторыю, плюсы і мінусы
малюнак: Nathan Oakley / CC BY

Гісторыя фармату

У 90-я на рынку электронных кніг панавалі прапрыетарныя рашэнні. І ў многіх вытворцаў чыталак быў уласны фармат. Напрыклад, у NuvoMedia выкарыстоўвалі файлы з пашырэннем .rb. Гэта былі кантэйнеры з HTML-файлам і файлам .info, утрымоўвальным метададзеныя. Такі стан рэчаў ускладняў працу выдаўцоў — ім даводзілася вярстаць кнігі пад кожны фармат паасобку. Выправіць становішча рэчаў узялася група інжынераў з Microsoft, ужо згаданай NuvoMedia і SoftBook Press.

У той час Microsoft збіралася заваёўваць рынак электронных кніг і займалася распрацоўкай прыкладання-чыталкі для Windows 95. Можна сказаць, што стварэнне новага фармату з'яўлялася часткай бізнес-стратэгіі ІТ-гіганта.

Калі казаць пра NuvoMedia, то гэтая кампанія лічыцца вытворцам першай масавай электроннай чыталкі. Rocket eBook. Унутраная памяць прылады складала ўсяго восем мегабайт, а час аўтаномнай працы не перавышала 40 гадзін. Што да SoftBook Press, яны таксама займаліся распрацоўкай электронных чыталак. Але іх дэвайсы мелі адметную асаблівасць – убудаваны мадэм – ён дазваляў спампоўваць лічбавую літаратуру напроста з крамы SoftBookstore.

У пачатку нулявых абедзве кампаніі – NuvoMedia і SoftBook – былі набытыя медыякампаніяй Gemstar і аб'яднаны ў Gemstar eBook Group. Гэтая арганізацыя яшчэ некалькі гадоў займалася продажам рыдэраў (напрыклад, RCA REB 1100) і лічбавых кніг, аднак у 2003 годзе выйшла з бізнэсу.

Але вернемся да распрацоўкі адзінага стандарта. У 1999 году Microsoft, NuvoMedia і SoftBook Press заснавалі арганізацыю Open eBook Forum, у складзе якой сталі працаваць над чарнавіком дакумента, якія паклалі пачатак EPUB. Першапачаткова стандарт называўся OEBPS (расшыфроўваецца як Open EBook Publication Structure). Ён дазволіў распаўсюджваць лічбавую публікацыю ў адным файле (ZIP-архіве) і спрасціў перанос кніг паміж рознымі апаратнымі платформамі.

Пазней да Open eBook Forum далучыліся ІТ-кампаніі Adobe, IBM, HP, Nokia, Xerox і выдаўцы McGraw Hill і Time Warner. Усе разам яны працягнулі распрацоўку OEBPS і займаліся развіццём экасістэмы лічбавай літаратуры ў цэлым. У 2005 годзе арганізацыю перайменавалі ў Міжнародны форум па лічбавых публікацыях, або IDPF.

У 2007 годзе IDPF змянілі назву фармату OEBPS на EPUB і пачалі распрацоўку ягонай другой версіі. Яе прадставілі шырокай публіцы ў 2010 годзе. Навінка амаль не адрознівалася ад свайго папярэдніка, аднак атрымала падтрымку вектарнай графікі і ўбудаваных шрыфтоў.

Да гэтага часу EPUB заваёўваў рынак і стаў стандартам па змаўчанні для многіх выдаўцоў і вытворцаў электронных гаджэтаў. Фарматам ужо карысталіся O'Reilly і Cisco Press, плюс яго падтрымлівалі прылады Apple, Sony, Barnes & Noble, ONYX BOOX.

У 2009 годзе праект Google Books абвясціў аб падтрымцы EPUB – яго выкарыстоўвалі для распаўсюджвання больш за мільён бясплатных кніг. Папулярнасць фармат пачаў набываць і ў пісьменнікаў. У 2011 годзе Джоан Роўлінг расказала аб планах запусціць сайт Pottermore і зрабіць яго адзінай кропкай продажаў кніг Потэрыяны ў лічбавым выглядзе.

Стандартам для распаўсюджвання літаратуры быў абраны EPUB, у першую чаргу з-за яго магчымасці рэалізаваць абарону ад капіравання (DRM). Усе кнігі ў анлайн-краме пісьменніцы да гэтага часу даступныя толькі ў гэтым у фармаце.

Трэцяя версія фармату EPUB выйшла ў 2011 годзе. Распрацоўнікі дадалі магчымасць працаваць з аўдыё-і відэафайламі і зноскамі. Сёння стандарт працягвае развівацца - у 2017 годзе IDPF. нават увайшла у склад кансорцыума W3C, які ўкараняе тэхналагічныя стандарты для Сусветнага павуціння.

Як уладкованы EPUB

Кніга ў фармаце EPUB уяўляе сабой ZIP-архіў. У ім захоўваецца тэкст публікацыі ў выглядзе XHTML- ці HTML-старонак або файлаў PDF. Таксама ў архіве ляжыць медыякантэнт (аўдыё, відэа ці малюнкі), шрыфты і метададзеныя. Яшчэ ў ім могуць знаходзіцца дадатковыя файлы са стылямі CSS або PLS-дакументы з інфармацыяй для сэрвісаў генерацыі прамовы.

За адлюстраванне кантэнту адказвае XML-разметка. Фрагмент кнігі з убудаваным аўдыёзапісам і выявай можа выглядаць наступным чынам:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html>
<html  
    
    epub_prefix="media: http://idpf.org/epub/vocab/media/#">
    <head>
        <meta charset="utf-8" />
        <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" />
    </head>
    <body>
        <section class="base">
            <h1>the entire transcript</h1>
            <audio id="bgsound" epub_type="media:soundtrack media:background"
                src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop="">
                <div class="errmsg">
                    <p>Your Reading System does not support (this) audio</p>
                </div>
            </audio>

            <p>What does it mean to be human if we don't have a shared culture? What
 does a shared culture mean if we can't share it? It's only in the last
 100, or 150 years or so, that we started tightly restricting how that
 culture gets used.</p>

            <img class="left" src="../images/326261902_3fa36f548d.jpg"
                alt="child against a wall" />
        </section>
    </body>
</html>

Апроч кантэнтных файлаў у архіве знаходзіцца адмысловы навігацыйны дакумент (Navigation Document). Ён апісвае размяшчэнне тэксту і выяваў у кнізе. Прыкладанні-рыдэры звяртаюцца да яго ў тым выпадку, калі чытач жадае «пераскочыць» праз некалькі старонак.

Яшчэ адзін абавязковы файл у архіве - package. Ён уключае ў сябе метададзеныя — інфармацыю пра аўтара, выдаўца, мову, назву і гэтак далей. Туды ж уваходзіць пералік (spine) падраздзелаў кнігі. Прыклад package-дакумента можна паглядзець у рэпазітары IDPF на GitHub.

годнасці

Перавага фармату - яго гнуткасць. EPUB дазваляе ствараць дынамічную разметку дакумента, якая адаптуецца пад памеры экрана прылады. Гэта адна з галоўных прычын, чаму фармат падтрымлівае вялікую колькасць чыталак (і іншых электронных прылад). Да прыкладу, з EPUB працуюць "са скрынкі" ўсе рыдары ONYX BOOX: ад базавай і 6-цалевай Caesar 3 да прэміяльнай і 9,7-цалевай Euclid.

Электронныя кнігі і іх фарматы: гаворым пра EPUB — яго гісторыю, плюсы і мінусы
/ ONYX BOOX Caesar 3

Бо фармат пабудаваны на аснове папулярных стандартаў (XML), яго лёгка канвертаваць для чытання ў інтэрнэце. Таксама EPUB падтрымлівае інтэрактыўныя элементы. Так, падобныя элементы яны ёсць і ў PDF, аднак дадаць іх у PDF-дакумент можна толькі з дапамогай прапрыетарнага праграмнага забеспячэння. У выпадку з EPUB яны дадаюцца ў кнігу разметкай і тэгамі XML у любым тэкставым рэдактары.

Іншай добрай якасцю EPUB з'яўляюцца функцыі для людзей, якія адчуваюць праблемы са зрокам ці пакутуюць дыслексіяй. Стандарт дае мадыфікаваць адлюстраванне тэксту на экране - напрыклад, падсвятліць пэўныя літараспалучэнні.

Яшчэ EPUB, як мы ўжо адзначылі, дае выдаўцу магчымасць устанавіць абарону ад капіявання. Пры жаданні прадаўцы электронных кніг могуць выкарыстоўваць свае механізмы, якія абмяжоўваюць доступ да дакумента. Для гэтага трэба мадыфікаваць файл rights.xml у архіве.

Недахопы

Для стварэння EPUB-публікацыі неабходна разбірацца ў сінтаксісе XML, XHTML і CSS. Пры гэтым даводзіцца працаваць з вялікай колькасцю метак-ідэнтыфікатараў. Для параўнання, той жа стандарт FB2 уключае ў сябе толькі мінімальна неабходны набор тэгаў - дастатковы для вёрсткі мастацкай літаратуры. А для стварэння PDF-дакументаў наогул не патрабуюцца адмысловыя веды - за ўсё адказвае спецыялізаванае ПЗ.

Таксама EPUB крытыкуюць за складанасць афармлення коміксаў і іншых кніг са мноствам ілюстрацый. У гэтым выпадку выдаўцу даводзіцца ствараць статычны макет з фіксаванымі каардынатамі для кожнай карцінкі - на гэта можа сыходзіць шмат сіл і часу.

Што далей

Цяпер IDPF працуе над новымі спецыфікацыямі для фармату. Напрыклад, адна з іх дапаможа ствараць інтэрактыўныя навучальныя дапаможнікі. са ўтоенымі раздзеламі. Адна і тая ж кніга будзе па-рознаму выглядаць для выкладчыка і студэнта - у другім выпадку апынуцца схаваныя, напрыклад, адказы на тэсты або кантрольныя пытанні.

Электронныя кнігі і іх фарматы: гаворым пра EPUB — яго гісторыю, плюсы і мінусы
малюнак: Гіян Болісай / CC BY-SA

Чакаецца, што новая функцыя дапаможа рэарганізаваць адукацыйны працэс. Сёння EPUB даволі актыўна выкарыстоўваецца буйнымі ВНУ, напрыклад Оксфардскім універсітэтам. Некалькі гадоў таму яны дадалі у сваё прыкладанне з лічбавай бібліятэкай падтрымку EPUB 3.0.

Таксама IDPF стварае спецыфікацыю для ўкаранення ў EPUB зносак Open Annotation. Гэты стандарт распрацавалі ў W3C у 2013 годзе - ён спрашчае працу са складанымі відамі анатацый. Напрыклад, з яго дапамогай можна паставіць нататку да вызначанага ўчастку JPEG-малюнка. Дадаткова стандарт рэалізуе механізм сінхранізацыі змен у анатацыях паміж копіямі аднаго EPUB-дакумента. Нататкі фармату Open Annotation можна дадаваць у EPUB-файлы і зараз, аднак фармальная спецыфікацыя для іх пакуль не прынята.

Таксама вядзецца праца над новай версіяй стандарту - EPUB 3.2. У ёй з'явяцца фарматы WOFF 2.0 и SFNT, якія выкарыстоўваюцца для сціску шрыфтоў (у некаторых выпадках яны дазваляюць скараціць памеры файла на 30%). Таксама распрацоўшчыкі заменяць некаторыя састарэлыя атрыбуты HTML. Напрыклад, замест асобнага элемента trigger для актывацыі аўдыё-і відэафайлаў у новым стандарце будуць натыўныя HTML-элементы audio і video.

чарнавік спецыфікацыі и спіс змен ужо даступныя ў GitHub-рэпазітары W3C.

Агляды чыталак ONYX-BOOX:

Крыніца: habr.com

Дадаць каментар