Elektroninės knygos ir jų formatai: kalbame apie EPUB – jo istoriją, pliusus ir minusus

Anksčiau tinklaraštyje rašėme apie tai, kaip atsirado elektroninių knygų formatai Djvu и FB2.

Šiandienos straipsnio tema yra EPUB.

Elektroninės knygos ir jų formatai: kalbame apie EPUB – jo istoriją, pliusus ir minusus
Paveikslėlis: Natanas Oakley / CC BY

Formato istorija

Dešimtajame dešimtmetyje elektroninių knygų rinkoje vyravo patentuoti sprendimai. Ir daugelis elektroninių skaitytuvų gamintojų turėjo savo formatą. Pavyzdžiui, NuvoMedia naudojo failus su plėtiniu .rb. Tai buvo konteineriai su HTML failu ir .info failu su metaduomenimis. Tokia padėtis apsunkino leidėjų darbą – jie turėjo rinkti knygas kiekvienam formatui atskirai. Situaciją ištaisyti ėmėsi „Microsoft“ inžinierių grupė, jau minėta „NuvoMedia“ ir „SoftBook Press“.

Tuo metu Microsoft ketino užkariauti elektroninių knygų rinką ir kūrė elektroninių skaitytuvų aplikaciją, skirtą Windows 95. Galima sakyti, kad naujo formato kūrimas buvo IT milžino verslo strategijos dalis.

Jei kalbėsime apie „NuvoMedia“, ši įmonė laikoma pirmojo masinio elektroninio skaitytuvo gamintoja Raketų elektroninė knyga. Vidinė įrenginio atmintis buvo tik aštuoni megabaitai, o baterijos veikimo laikas neviršijo 40 valandų. Kalbant apie „SoftBook Press“, jie taip pat sukūrė elektroninius skaitytuvus. Tačiau jų įrenginiai turėjo išskirtinę savybę – įmontuotą modemą – tai leido atsisiųsti skaitmeninę literatūrą tiesiai iš SoftBookstore.

XNUMX-ųjų pradžioje abi įmones – „NuvoMedia“ ir „SoftBook“ – įsigijo žiniasklaidos bendrovė „Gemstar“ ir jos susijungė į „Gemstar eBook Group“. Ši organizacija keletą metų pardavinėjo skaitytojus (pvz., RCA REB 1100) ir skaitmenines knygas, tačiau 2003 m išėjo iš verslo.

Bet grįžkime prie vieno standarto kūrimo. 1999 m. „Microsoft“, „NuvoMedia“ ir „SoftBook Press“ įkūrė „Open eBook Forum“, kuris pradėjo kurti dokumento projektą, žymintį EPUB pradžią. Iš pradžių standartinis buvo vadinama OEBPS (reiškia Open EBook Publication Structure). Tai leido platinti skaitmeninį leidinį viename faile (ZIP archyve) ir palengvino knygų perkėlimą tarp skirtingų aparatinės įrangos platformų.

Vėliau IT įmonės Adobe, IBM, HP, Nokia, Xerox ir leidėjai McGraw Hill ir Time Warner prisijungė prie Open eBook Forum. Kartu jie toliau kūrė OEBPS ir kūrė visą skaitmeninės literatūros ekosistemą. 2005 metais organizacija buvo pervadinta į Tarptautinį skaitmeninės leidybos forumą arba IDPF.

2007 m. IDPF pakeitė OEBPS formato pavadinimą į EPUB ir pradėjo kurti antrąją jo versiją. Plačiajai visuomenei jis buvo pristatytas 2010 m. Tačiau naujasis produktas beveik nesiskyrė nuo savo pirmtako gavo paramą vektorinė grafika ir integruoti šriftai.

Iki to laiko EPUB užvaldė rinką ir tapo numatytuoju standartu daugeliui leidėjų ir elektroninių įtaisų gamintojų. Formatą jau naudojo O'Reilly ir Cisco Press, be to, jį palaikė Apple, Sony, Barnes & Noble ir ONYX BOOX įrenginiai.

2009 m. „Google“ knygų projektas paskelbė apie EPUB palaikymą – juo buvo išplatinta daugiau nei milijonas nemokamų knygų. Formatas pradėjo populiarėti tarp rašytojų. 2011 m. JK Rowling papasakojo apie planus paleiskite Pottermo svetainę ir paverskite ją vienintele skaitmeninės formos Poterio knygų pardavimo vieta.

EPUB buvo pasirinktas kaip literatūros platinimo standartas, visų pirma dėl galimybės įdiegti apsaugą nuo kopijavimo (DRM). Visos knygos rašytojo internetinėje parduotuvėje iki šiol galima tik šiuo formatu.

Trečioji EPUB formato versija buvo išleista 2011 m. Kūrėjai pridėjo galimybę dirbti su garso ir vaizdo failais bei išnašomis. Šiandien standartas toliau tobulėja – 2017 m. IDPF net įėjo W3C konsorciumo, diegiančio pasaulinio žiniatinklio technologijų standartus, dalis.

Kaip veikia EPUB

EPUB formato knyga yra ZIP archyvas. Ji saugo leidinio tekstą XHTML arba HTML puslapių arba PDF failų pavidalu. Archyve taip pat yra medijos turinio (garso, vaizdo ar vaizdų), šriftų ir metaduomenų. Jame taip pat gali būti papildomų failų su CSS stiliais arba PLS-dokumentai su informacija kalbos generavimo paslaugoms.

XML žymėjimas yra atsakingas už turinio rodymą. Knygos fragmentas su įterptu garsu ir vaizdu gali atrodyti taip:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html>
<html  
    
    epub_prefix="media: http://idpf.org/epub/vocab/media/#">
    <head>
        <meta charset="utf-8" />
        <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" />
    </head>
    <body>
        <section class="base">
            <h1>the entire transcript</h1>
            <audio id="bgsound" epub_type="media:soundtrack media:background"
                src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop="">
                <div class="errmsg">
                    <p>Your Reading System does not support (this) audio</p>
                </div>
            </audio>

            <p>What does it mean to be human if we don't have a shared culture? What
 does a shared culture mean if we can't share it? It's only in the last
 100, or 150 years or so, that we started tightly restricting how that
 culture gets used.</p>

            <img class="left" src="../images/326261902_3fa36f548d.jpg"
                alt="child against a wall" />
        </section>
    </body>
</html>

Be turinio failų, archyve yra specialus naršymo dokumentas (Navigation Document). Jame aprašomas teksto ir vaizdų išdėstymas knygoje. Skaitytojo programos jį pasiekia, jei skaitytojas nori „praleisti“ kelis puslapius.

Kitas reikalingas failas archyve yra paketas. Tai apima metaduomenis – informaciją apie autorių, leidėją, kalbą, pavadinimą ir pan. Jame taip pat yra knygos poskyrių sąrašas (stuburas). Galima peržiūrėti paketo dokumento pavyzdį „GitHub“ IDPF saugykloje.

orumas

Formato privalumas yra jo lankstumas. EPUB leidžia sukurti dinamišką dokumento maketą, prisitaikantį prie įrenginio ekrano dydžio. Tai viena iš pagrindinių priežasčių, kodėl formatą palaiko daugybė skaitytuvų (ir kitų elektroninių įrenginių). Pavyzdžiui, visi ONYX BOOX skaitytuvai veikia su EPUB iš karto: nuo pagrindinio ir 6 colių Cezaris 3 iki aukščiausios kokybės ir 9,7 colio Euklidas.

Elektroninės knygos ir jų formatai: kalbame apie EPUB – jo istoriją, pliusus ir minusus
/ ONYX BOOX Cezaris 3

Kadangi formatas yra pagrįstas populiariais standartais (XML), jį lengva konvertuoti skaitymui internete. EPUB taip pat palaiko interaktyvius elementus. Taip, PDF yra panašių elementų, tačiau juos galite įtraukti į PDF dokumentą tik naudodami patentuotą programinę įrangą. EPUB atveju jie pridedami prie knygos naudojant žymėjimą ir XML žymas bet kuriame teksto rengyklėje.

Kitas EPUB privalumas yra jo savybės žmonėms, turintiems regėjimo problemų ar disleksijos. Standartas leidžia keisti teksto pateikimą ekrane – pavyzdžiui, paryškinti tam tikrus raidžių derinius.

EPUB, kaip jau minėjome, suteikia leidėjui galimybę įdiegti apsaugą nuo kopijavimo. Jei pageidaujate, elektroninių knygų pardavėjai gali naudoti jų mechanizmai, ribojantys prieigą prie dokumento. Norėdami tai padaryti, turite modifikuoti failą Rights.xml archyve.

Trūkumai

Norėdami sukurti EPUB leidinį, turite suprasti XML, XHTML ir CSS sintaksę. Tokiu atveju turite dirbti su daugybe identifikatorių. Palyginimui, tas pats FB2 standartas apima tik minimalų reikalingą žymų rinkinį – pakanka grožinės literatūros išdėstymui. Ir kurti PDF dokumentai Specialių žinių visiškai nereikia – už viską atsakinga specializuota programinė įranga.

EPUB taip pat kritikuojamas dėl sudėtingo komiksų ir kitų knygų su daugybe iliustracijų dizaino. Tokiu atveju leidėjas turi sukurti statinį kiekvieno vaizdo maketą su nustatytomis koordinatėmis – tai gali pareikalauti daug pastangų ir laiko.

Kas toliau?

IDPF šiuo metu rengia naujas formato specifikacijas. Pavyzdžiui, vienas iš jų padės sukurti interaktyvius vadovėlius su paslėptomis dalimis. Ta pati knyga mokytojui ir mokiniui atrodys skirtingai – antruoju atveju, pavyzdžiui, atsakymai į testus ar kontrolinius klausimus bus paslėpti.

Elektroninės knygos ir jų formatai: kalbame apie EPUB – jo istoriją, pliusus ir minusus
Paveikslėlis: Guianas Bolisay / CC BY-SA

Tikimasi, kad nauja funkcija padės pertvarkyti ugdymo procesą. Šiandien EPUB gana aktyviai naudoja dideli universitetai, pavyzdžiui, Oksfordo universitetas. Prieš keletą metų jie pridėta EPUB 3.0 palaikymas jūsų skaitmeninės bibliotekos programoje.

IDPF taip pat kuria specifikaciją, skirtą Open Annotation išnašoms įgyvendinti EPUB. Šį standartą 3 m. sukūrė W2013C – jis supaprastina darbą su sudėtingų tipų anotacijomis. Pavyzdžiui, galite jį naudoti norėdami pridėti pastabą prie konkrečios JPEG vaizdo dalies. Neprivalomas standartas įgyvendina mechanizmą sinchronizuoti anotacijų pakeitimus tarp to paties EPUB dokumento kopijų. Atidarykite komentaro formato pastabas Jūs galite pridėti į EPUB failus ir dabar, tačiau oficiali jų specifikacija dar nepriimta.

Taip pat dirbama su nauja standarto versija – EPUB 3.2. Jame bus formatai WOFF 2.0 и SFNT, kurie naudojami šriftams suspausti (kai kuriais atvejais jie gali sumažinti failų dydį 30%). Kūrėjai taip pat pakeis kai kuriuos pasenusius HTML atributus. Pavyzdžiui, vietoj atskiro trigerio elemento garso ir vaizdo failams aktyvuoti, naujasis standartas turės vietinius HTML garso ir vaizdo elementus.

Juodraštis specifikacijos и Pakeitimų sąrašas jau yra W3C GitHub saugykloje.

ONYX-BOOX elektroninių skaitytuvų apžvalgos:

Šaltinis: www.habr.com

Добавить комментарий