Elektronické knihy a ich formáty: hovoríme o EPUB - jeho histórii, plusoch a mínusoch

Predtým v blogu sme písali o tom, ako sa objavili formáty elektronických kníh Djvu и FB2.

Témou dnešného článku je EPUB.

Elektronické knihy a ich formáty: hovoríme o EPUB - jeho histórii, plusoch a mínusoch
obrázok: Nathan Oakley / CC BY

História formátu

V 90. rokoch ovládli trh s elektronickými knihami proprietárne riešenia. A mnoho výrobcov elektronických čítačiek malo svoj vlastný formát. Napríklad NuvoMedia používala súbory s príponou .rb. Išlo o kontajnery so súborom HTML a súborom .info obsahujúcim metadáta. Tento stav skomplikoval prácu vydavateľom – knihy museli vysádzať pre každý formát zvlášť. Napraviť situáciu sa podujala skupina inžinierov z Microsoftu, už spomínaná NuvoMedia a SoftBook Press.

V tom čase sa Microsoft chystal dobyť trh s elektronickými knihami a vyvíjal aplikáciu elektronickej čítačky pre Windows 95. Dá sa povedať, že vytvorenie nového formátu bolo súčasťou obchodnej stratégie IT giganta.

Ak hovoríme o NuvoMedia, táto spoločnosť je považovaná za výrobcu prvej hromadnej elektronickej čítačky Elektronická kniha o rakete. Vnútorná pamäť zariadenia mala len osem megabajtov a výdrž batérie nepresiahla 40 hodín. Čo sa týka SoftBook Press, vyvinuli aj elektronické čítačky. Ich zariadenia však mali charakteristickú vlastnosť – vstavaný modem – umožňoval vám sťahovať digitálnu literatúru priamo zo SoftBookstore.

Začiatkom roku XNUMX obe spoločnosti - NuvoMedia a SoftBook - kúpila mediálna spoločnosť Gemstar a zlúčili sa do skupiny Gemstar eBook Group. Táto organizácia pokračovala v predaji čítačiek niekoľko rokov (napr. RCA REB 1100) a digitálnych kníh, avšak v roku 2003 vypadol z podnikania.

Vráťme sa však k vývoju jednotného štandardu. V roku 1999 Microsoft, NuvoMedia a SoftBook Press založili Open eBook Forum, ktoré začalo pracovať na návrhu dokumentu, ktorý znamenal začiatok EPUB. Pôvodne štandardné bola volaná OEBPS (skratka pre Open EBook Publication Structure). Umožnil distribuovať digitálnu publikáciu v jednom súbore (ZIP archív) a zjednodušil prenos kníh medzi rôznymi hardvérovými platformami.

Neskôr sa k Open eBook Forum pripojili IT spoločnosti Adobe, IBM, HP, Nokia, Xerox a vydavatelia McGraw Hill a Time Warner. Spoločne pokračovali vo vývoji OEBPS a rozvíjali ekosystém digitálnej literatúry ako celku. V roku 2005 sa organizácia premenovala na Medzinárodné fórum pre digitálne publikovanie, príp IDPF.

V roku 2007 IDPF zmenil názov formátu OEBPS na EPUB a začal vyvíjať jeho druhú verziu. V roku 2010 bol predstavený širokej verejnosti. Nový produkt sa však takmer nelíšil od svojho predchodcu dostali podporu vektorová grafika a vstavané fonty.

V tom čase EPUB preberal trh a stal sa predvoleným štandardom pre mnohých vydavateľov a výrobcov elektronických zariadení. Tento formát už používali O'Reilly a Cisco Press a navyše ho podporovali zariadenia Apple, Sony, Barnes & Noble a ONYX BOOX.

V roku 2009 projekt Google Books oznámil o podpore EPUB - bol použitý na distribúciu viac ako milióna bezplatných kníh. Formát si začal získavať na popularite medzi spisovateľmi. V roku 2011 JK Rowling povedal o plánoch spustiť webovú stránku Pottermore a urobiť z nej jediné miesto predaja potterovských kníh v digitálnej podobe.

EPUB bol vybraný ako štandard pre distribúciu literatúry, predovšetkým kvôli jeho schopnosti implementovať ochranu proti kopírovaniu (DRM). Všetky knihy zatiaľ v internetovom obchode spisovateľa dostupné iba v tomto formáte.

Tretia verzia formátu EPUB bola vydaná v roku 2011. Vývojári pridali možnosť práce so zvukovými a video súbormi a poznámkami pod čiarou. Dnes sa štandard naďalej vyvíja - v roku 2017 IDPF dokonca vošiel súčasť konzorcia W3C, ktoré implementuje technologické štandardy pre World Wide Web.

Ako funguje EPUB

Kniha vo formáte EPUB je archív ZIP. Ukladá text publikácie vo forme XHTML alebo HTML stránok alebo súborov PDF. Archív obsahuje aj mediálny obsah (audio, video alebo obrázky), fonty a metadáta. Môže obsahovať aj ďalšie súbory s CSS štýlmi resp PLS-dokumenty s informáciami pre služby generovania reči.

Označenie XML je zodpovedné za zobrazovanie obsahu. Fragment knihy s vloženým zvukom a obrázkom môže vyzerať takto:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html>
<html  
    
    epub_prefix="media: http://idpf.org/epub/vocab/media/#">
    <head>
        <meta charset="utf-8" />
        <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" />
    </head>
    <body>
        <section class="base">
            <h1>the entire transcript</h1>
            <audio id="bgsound" epub_type="media:soundtrack media:background"
                src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop="">
                <div class="errmsg">
                    <p>Your Reading System does not support (this) audio</p>
                </div>
            </audio>

            <p>What does it mean to be human if we don't have a shared culture? What
 does a shared culture mean if we can't share it? It's only in the last
 100, or 150 years or so, that we started tightly restricting how that
 culture gets used.</p>

            <img class="left" src="../images/326261902_3fa36f548d.jpg"
                alt="child against a wall" />
        </section>
    </body>
</html>

Okrem súborov s obsahom archív obsahuje špeciálny navigačný dokument (Navigačný dokument). Popisuje usporiadanie textu a obrázkov v knihe. Čitateľské aplikácie k nemu pristupujú, ak chce čitateľ „preskočiť“ niekoľko strán.

Ďalším požadovaným súborom v archíve je package. Zahŕňa metadáta – informácie o autorovi, vydavateľovi, jazyku, názve a pod. Obsahuje aj zoznam (chrbát) podsekcií knihy. Môžete si pozrieť príklad balíkového dokumentu v úložisku IDPF na GitHub.

dôstojnosť

Výhodou formátu je jeho flexibilita. EPUB vám umožňuje vytvárať dynamické rozloženie dokumentu, ktoré sa prispôsobuje veľkosti obrazovky vášho zariadenia. To je jeden z hlavných dôvodov, prečo formát podporuje veľké množstvo čítačiek (a iných elektronických zariadení). Napríklad všetky čítačky ONYX BOOX pracujú s EPUB hneď po vybalení: od základnej a 6-palcovej caesar 3 až po prémiové a 9,7-palcové Euclid.

Elektronické knihy a ich formáty: hovoríme o EPUB - jeho histórii, plusoch a mínusoch
/ ONYX BOOX Caesar 3

Keďže formát je založený na populárnych štandardoch (XML), je ľahké ho previesť na čítanie na internete. EPUB podporuje aj interaktívne prvky. Áno, podobné prvky existujú v PDF, ale do dokumentu PDF ich môžete pridať iba pomocou proprietárneho softvéru. V prípade EPUB sa do knihy pridávajú pomocou značiek a XML tagov v ľubovoľnom textovom editore.

Ďalšou výhodou EPUB sú jeho funkcie pre ľudí s problémami so zrakom alebo dyslexiou. Norma umožňuje upraviť zobrazenie textu na obrazovke – napríklad zvýrazniť určité kombinácie písmen.

EPUB, ako sme už uviedli, dáva vydavateľovi možnosť nainštalovať ochranu proti kopírovaniu. Predajcovia e-kníh v prípade záujmu môcť použiť ich mechanizmy obmedzujúce prístup k dokumentu. Na to je potrebné upraviť súbor rights.xml v archíve.

Obmedzenie

Ak chcete vytvoriť publikáciu EPUB, musíte pochopiť syntax XML, XHTML a CSS. V tomto prípade musíte pracovať s veľkým množstvom identifikátorov. Pre porovnanie, to isté štandard FB2 obsahuje iba minimálnu požadovanú sadu značiek – dostatočnú na rozloženie beletrie. A vytvárať PDF dokumenty Nie sú potrebné žiadne špeciálne znalosti - za všetko je zodpovedný špecializovaný softvér.

EPUB je vyčítaná aj zložitosť dizajnu komiksov a iných kníh s množstvom ilustrácií. V tomto prípade musí vydavateľ pre každý obrázok vytvoriť statické rozloženie s pevnými súradnicami – to môže vyžadovať veľa úsilia a času.

čo ďalej

IDPF momentálne pracuje na nových špecifikáciách formátu. Jeden z nich vám napríklad pomôže vytvoriť interaktívne návody so skrytými časťami. Tá istá kniha bude vyzerať inak pre učiteľa a žiaka – v druhom prípade sa skryjú napríklad odpovede na testy či kontrolné otázky.

Elektronické knihy a ich formáty: hovoríme o EPUB - jeho histórii, plusoch a mínusoch
obrázok: Guian Bolisay / CC BY-SA

Očakáva sa, že nová funkcia pomôže reorganizovať vzdelávací proces. EPUB dnes pomerne aktívne využívajú veľké univerzity, napríklad Oxfordská univerzita. Pred pár rokmi oni dodal Podpora EPUB 3.0 vo vašej aplikácii digitálnej knižnice.

IDPF tiež vytvára špecifikáciu na implementáciu poznámok pod čiarou Open Annotation v EPUB. Tento štandard bol vyvinutý W3C v roku 2013 – zjednodušuje prácu so zložitými typmi anotácií. Môžete ho použiť napríklad na pridanie poznámky do určitej časti obrázka JPEG. Voliteľný štandard implementuje mechanizmus synchronizácia zmien v anotáciách medzi kópiami toho istého dokumentu EPUB. Otvorte Poznámky vo formáte anotácie môžete pridať do súborov EPUB aj teraz, no formálna špecifikácia pre ne ešte nebola prijatá.

Pracuje sa aj na novej verzii štandardu – EPUB 3.2. Bude obsahovať formáty WOFF 2.0 и SFNT, ktoré sa používajú na kompresiu fontov (v niektorých prípadoch dokážu zmenšiť veľkosť súborov o 30 %). Vývojári tiež nahradia niektoré zastarané atribúty HTML. Napríklad namiesto samostatného spúšťacieho prvku na aktiváciu audio a video súborov bude mať nový štandard natívne HTML audio a video elementy.

Návrh technické údaje и Zoznam zmien sú už dostupné v úložisku W3C GitHub.

Recenzie elektronických čítačiek ONYX-BOOX:

Zdroj: hab.com

Pridať komentár