Elektronické knihy a jejich formáty: mluvíme o EPUB - jeho historii, klady a zápory

Dříve v blogu jsme psali o tom, jak se formáty e-knih objevily DjVu и FB2.

Tématem dnešního článku je EPUB.

Elektronické knihy a jejich formáty: mluvíme o EPUB - jeho historii, klady a zápory
Obrázek: Nathan Oakley / CC BY

Historie formátu

V 90. letech ovládla trh elektronických knih proprietární řešení. A mnoho výrobců elektronických čteček mělo svůj vlastní formát. Například společnost NuvoMedia používala soubory s příponou .rb. Jednalo se o kontejnery se souborem HTML a souborem .info obsahující metadata. Tento stav komplikoval nakladatelům práci - museli vysázet knihy pro každý formát zvlášť. Napravit situaci se ujala skupina inženýrů z Microsoftu, již zmíněná NuvoMedia a SoftBook Press.

Microsoft se v té době chystal dobýt trh s e-knihami a vyvíjel e-čtečkovou aplikaci pro Windows 95. Dá se říci, že vytvoření nového formátu bylo součástí obchodní strategie IT giganta.

Pokud mluvíme o NuvoMedia, tato společnost je považována za výrobce první hromadné elektronické čtečky Elektronická kniha raketa. Vnitřní paměť zařízení byla pouhých osm megabajtů a výdrž baterie nepřesáhla 40 hodin. Pokud jde o SoftBook Press, vyvinuli také elektronické čtečky. Jejich zařízení ale měla charakteristickou vlastnost – vestavěný modem – umožňovala stahovat digitální literaturu přímo ze SoftBookstore.

Na začátku roku XNUMX byly obě společnosti - NuvoMedia a SoftBook - koupeny mediální společností Gemstar a sloučeny do skupiny Gemstar eBook Group. Tato organizace pokračovala v prodeji čtenářů několik let (např. RCA REB 1100) a digitální knihy, nicméně v roce 2003 vyšel z podnikání.

Ale vraťme se k vývoji jednotného standardu. V roce 1999 Microsoft, NuvoMedia a SoftBook Press založily Open eBook Forum, které začalo pracovat na návrhu dokumentu, který znamenal začátek EPUB. Původně standardní byl zavolán OEBPS (zkratka pro Open EBook Publication Structure). Umožnil distribuci digitální publikace v jediném souboru (archiv ZIP) a usnadnil přenos knih mezi různými hardwarovými platformami.

Později se k Open eBook Forum připojily IT společnosti Adobe, IBM, HP, Nokia, Xerox a vydavatelé McGraw Hill a Time Warner. Společně pokračovali ve vývoji OEBPS a rozvoji ekosystému digitální literatury jako celku. V roce 2005 byla organizace přejmenována na International Forum for Digital Publishing, popř IDPF.

V roce 2007 IDPF změnil název formátu OEBPS na EPUB a začal vyvíjet jeho druhou verzi. V roce 2010 byl představen široké veřejnosti. Nový produkt se však od svého předchůdce téměř nelišil dostal podporu vektorová grafika a vestavěná písma.

V té době EPUB přebíral trh a stal se výchozím standardem pro mnoho vydavatelů a výrobců elektronických zařízení. Formát již používal O'Reilly a Cisco Press a navíc jej podporovaly zařízení Apple, Sony, Barnes & Noble a ONYX BOOX.

V roce 2009 projekt Google Books oznámeno o podpoře EPUB - byl použit k distribuci více než milionu knih zdarma. Formát začal získávat na popularitě mezi spisovateli. V roce 2011, JK Rowling řekl o plánech spustit web Pottermore a učinit z něj jediné místo prodeje potterovských knih v digitální podobě.

EPUB byl vybrán jako standard pro distribuci literatury především kvůli své schopnosti implementovat ochranu proti kopírování (DRM). Všechny knihy dosud v internetovém obchodě spisovatele k dispozici pouze v tomto formátu.

Třetí verze formátu EPUB byla vydána v roce 2011. Vývojáři přidali možnost práce s audio a video soubory a poznámkami pod čarou. Dnes se standard nadále vyvíjí - v roce 2017 IDPF dokonce vešel součást konsorcia W3C, které implementuje technologické standardy pro World Wide Web.

Jak funguje EPUB

Kniha ve formátu EPUB je archiv ZIP. Ukládá text publikace ve formě XHTML nebo HTML stránek nebo souborů PDF. Archiv obsahuje také mediální obsah (audio, video nebo obrázky), fonty a metadata. Může obsahovat i další soubory s CSS styly popř PLS-dokumenty s informacemi pro služby generování řeči.

Označení XML je zodpovědné za zobrazování obsahu. Fragment knihy s vloženým zvukem a obrázkem může vypadat takto:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html>
<html  
    
    epub_prefix="media: http://idpf.org/epub/vocab/media/#">
    <head>
        <meta charset="utf-8" />
        <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" />
    </head>
    <body>
        <section class="base">
            <h1>the entire transcript</h1>
            <audio id="bgsound" epub_type="media:soundtrack media:background"
                src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop="">
                <div class="errmsg">
                    <p>Your Reading System does not support (this) audio</p>
                </div>
            </audio>

            <p>What does it mean to be human if we don't have a shared culture? What
 does a shared culture mean if we can't share it? It's only in the last
 100, or 150 years or so, that we started tightly restricting how that
 culture gets used.</p>

            <img class="left" src="../images/326261902_3fa36f548d.jpg"
                alt="child against a wall" />
        </section>
    </body>
</html>

Kromě souborů s obsahem obsahuje archiv speciální navigační dokument (Navigační dokument). Popisuje uspořádání textu a obrázků v knize. Čtenářské aplikace k němu přistupují, pokud chce čtenář „přeskočit“ několik stránek.

Dalším požadovaným souborem v archivu je package. Zahrnuje metadata – informace o autorovi, vydavateli, jazyce, názvu a podobně. Obsahuje také seznam (hřbet) pododdílů knihy. Můžete si prohlédnout příklad dokumentu balíčku v úložišti IDPF na GitHubu.

Hodnota

Výhodou formátu je jeho flexibilita. EPUB umožňuje vytvářet dynamické rozložení dokumentu, které se přizpůsobí velikosti obrazovky vašeho zařízení. To je jeden z hlavních důvodů, proč formát podporuje velké množství čteček (a dalších elektronických zařízení). Například všechny čtečky ONYX BOOX pracují s EPUB ihned po vybalení: od základních a 6palcových caesar 3 až po prémiové a 9,7palcové Euclid.

Elektronické knihy a jejich formáty: mluvíme o EPUB - jeho historii, klady a zápory
/ ONYX BOOX Caesar 3

Vzhledem k tomu, že formát je založen na populárních standardech (XML), je snadné jej převést pro čtení na internetu. EPUB také podporuje interaktivní prvky. Ano, podobné prvky v PDF existují, ale do dokumentu PDF je můžete přidat pouze pomocí proprietárního softwaru. V případě EPUB jsou přidány do knihy pomocí značek a XML tagů v libovolném textovém editoru.

Další výhodou EPUB jsou jeho funkce pro lidi s problémy se zrakem nebo dyslexií. Norma umožňuje upravit zobrazení textu na obrazovce – například zvýraznit určité kombinace písmen.

EPUB, jak jsme již poznamenali, dává vydavateli možnost nainstalovat ochranu proti kopírování. Prodejci e-knih v případě zájmu může použít jejich mechanismy omezující přístup k dokumentu. K tomu je potřeba upravit soubor rights.xml v archivu.

Omezení

Chcete-li vytvořit publikaci EPUB, musíte rozumět syntaxi XML, XHTML a CSS. V tomto případě musíte pracovat s velkým množstvím identifikátorů. Pro srovnání to samé standard FB2 obsahuje pouze minimální požadovanou sadu značek – dostačující pro rozvržení beletrie. A tvořit PDF dokumenty Nejsou potřeba žádné speciální znalosti – za vše je zodpovědný specializovaný software.

EPUB je také kritizován za složitost designu komiksů a dalších knih s mnoha ilustracemi. V tomto případě musí vydavatel pro každý obrázek vytvořit statické rozvržení s pevnými souřadnicemi – to může vyžadovat spoustu úsilí a času.

Co je další

IDPF v současné době pracuje na nových specifikacích pro formát. Jeden z nich vám například pomůže vytvořit interaktivní výukové programy se skrytými sekcemi. Stejná kniha bude pro učitele a studenta vypadat jinak – v druhém případě se skryjí například odpovědi na testy nebo kontrolní otázky.

Elektronické knihy a jejich formáty: mluvíme o EPUB - jeho historii, klady a zápory
Obrázek: Guian Bolisay / CC BY-SA

Očekává se, že nová funkce pomůže reorganizovat vzdělávací proces. EPUB dnes poměrně aktivně využívají velké univerzity, například Oxfordská univerzita. Před pár lety oni přidal Podpora EPUB 3.0 ve vaší aplikaci digitální knihovny.

IDPF také vytváří specifikaci pro implementaci poznámek pod čarou Open Annotation v EPUB. Tento standard byl vyvinut W3C v roce 2013 – zjednodušuje práci se složitými typy anotací. Můžete jej například použít k přidání poznámky do určité části obrázku JPEG. Volitelný standard implementuje mechanismus synchronizace změn v anotacích mezi kopiemi stejného dokumentu EPUB. Otevřete Poznámky ve formátu anotace Můžete přidat do souborů EPUB i nyní, ale formální specifikace pro ně ještě nebyla přijata.

Pracuje se také na nové verzi standardu – EPUB 3.2. Bude obsahovat formáty WOFF 2.0 и SFNT, které se používají ke kompresi písem (v některých případech mohou zmenšit velikost souborů o 30 %). Vývojáři také nahradí některé zastaralé atributy HTML. Například místo samostatného spouštěcího prvku pro aktivaci audio a video souborů bude mít nový standard nativní HTML audio a video prvky.

Návrh Specifikace и Seznam změn jsou již k dispozici v úložišti W3C GitHub.

Recenze e-čteček ONYX-BOOX:

Zdroj: www.habr.com

Přidat komentář