Mga elektronikong libro at ang kanilang mga format: pinag-uusapan natin ang tungkol sa EPUB - ang kasaysayan nito, mga kalamangan at kahinaan

Mas maaga sa blog na sinulat namin tungkol sa kung paano lumitaw ang mga format ng e-book Djvu ΠΈ FB2.

Ang paksa ng artikulo ngayon ay EPUB.

Mga elektronikong libro at ang kanilang mga format: pinag-uusapan natin ang tungkol sa EPUB - ang kasaysayan nito, mga kalamangan at kahinaan
Larawan: Nathan Oakley / CC NI

Kasaysayan ng format

Noong 90s, ang merkado ng e-book ay pinangungunahan ng mga pagmamay-ari na solusyon. At maraming mga tagagawa ng e-reader ang may sariling format. Halimbawa, gumamit ang NuvoMedia ng mga file na may extension na .rb. Ito ay mga lalagyan na may HTML file at isang .info file na naglalaman ng metadata. Ang kalagayang ito ay kumplikado sa gawain ng mga publisher - kailangan nilang mag-typeset ng mga libro para sa bawat format nang hiwalay. Isang grupo ng mga inhinyero mula sa Microsoft, ang nabanggit na NuvoMedia at SoftBook Press ang nagsagawa upang iwasto ang sitwasyon.

Sa oras na iyon, sasakupin ng Microsoft ang merkado ng e-book at bubuo ng isang e-reader application para sa Windows 95. Masasabi nating ang paglikha ng bagong format ay bahagi ng diskarte sa negosyo ng IT giant.

Kung pinag-uusapan natin ang tungkol sa NuvoMedia, ang kumpanyang ito ay itinuturing na tagagawa ng unang mass electronic reader Rocket eBook. Ang panloob na memorya ng aparato ay walong megabytes lamang, at ang buhay ng baterya ay hindi lalampas sa 40 oras. Tulad ng para sa SoftBook Press, nakabuo din sila ng mga electronic reader. Ngunit ang kanilang mga device ay may natatanging tampok - isang built-in na modem - pinapayagan ka nitong mag-download ng digital literature nang direkta mula sa SoftBookstore.

Sa simula ng XNUMXs, ang parehong mga kumpanya - NuvoMedia at SoftBook - ay binili ng kumpanya ng media na Gemstar at pinagsama sa Gemstar eBook Group. Ang organisasyong ito ay patuloy na nagbebenta ng mga mambabasa sa loob ng ilang taon (halimbawa, RCA REB 1100) at mga digital na aklat, gayunpaman noong 2003 nawala sa negosyo.

Ngunit bumalik tayo sa pagbuo ng isang solong pamantayan. Noong 1999, itinatag ng Microsoft, NuvoMedia at SoftBook Press ang Open eBook Forum, na nagsimulang magtrabaho sa draft na dokumento na minarkahan ang simula ng EPUB. Orihinal na pamantayan tinawag OEBPS (ang ibig sabihin ay Open EBook Publication Structure). Ginawa nitong posible na ipamahagi ang isang digital na publikasyon sa isang solong file (ZIP archive) at pinadali ang paglipat ng mga aklat sa pagitan ng iba't ibang mga platform ng hardware.

Nang maglaon, sumali sa Open eBook Forum ang mga kumpanyang IT na Adobe, IBM, HP, Nokia, Xerox at mga publisher na sina McGraw Hill at Time Warner. Sama-sama silang nagpatuloy sa pagbuo ng OEBPS at pagbuo ng digital literature ecosystem sa kabuuan. Noong 2005, pinalitan ang pangalan ng organisasyon na International Forum for Digital Publishing, o IDPF.

Noong 2007, pinalitan ng IDPF ang pangalan ng format ng OEBPS sa EPUB at nagsimulang bumuo ng pangalawang bersyon nito. Ito ay ipinakita sa pangkalahatang publiko noong 2010. Ang bagong produkto ay halos hindi naiiba sa hinalinhan nito, gayunpaman nakatanggap ng suporta vector graphics at mga built-in na font.

Sa oras na ito, ang EPUB ay pumalit sa merkado at naging default na pamantayan para sa maraming mga publisher at mga tagagawa ng electronic gadget. Ang format ay ginamit na ng O'Reilly at Cisco Press, at sinusuportahan ito ng mga Apple, Sony, Barnes & Noble, at ONYX BOOX device.

Noong 2009, ang proyekto ng Google Books inihayag tungkol sa suporta para sa EPUB - ito ay ginamit upang ipamahagi ang higit sa isang milyong libreng aklat. Ang format ay nagsimulang makakuha ng katanyagan sa mga manunulat. Noong 2011, si JK Rowling sinabi tungkol sa mga plano ilunsad ang website ng Pottermore at gawin itong ang tanging punto ng pagbebenta ng mga aklat ng Potter sa digital form.

Napili ang EPUB bilang pamantayan para sa pamamahagi ng literatura, pangunahin dahil sa kakayahang magpatupad ng proteksyon ng kopya (DRM). Ang lahat ng mga libro sa online na tindahan ng manunulat sa ngayon available lang sa ganitong format.

Ang ikatlong bersyon ng format na EPUB ay inilabas noong 2011. Nagdagdag ang mga developer ng kakayahang magtrabaho kasama ang mga audio at video file at footnote. Ngayon ang pamantayan ay patuloy na nagbabago - sa 2017 IDPF kahit pumasok bahagi ng W3C consortium, na nagpapatupad ng mga pamantayan ng teknolohiya para sa World Wide Web.

Paano gumagana ang EPUB

Ang isang aklat sa format na EPUB ay isang ZIP archive. Iniimbak nito ang teksto ng publikasyon sa anyo ng mga XHTML o HTML na pahina o mga PDF file. Naglalaman din ang archive ng nilalaman ng media (audio, video o mga larawan), mga font at metadata. Maaari rin itong maglaman ng mga karagdagang file na may mga estilo ng CSS o PLS-mga dokumentong may impormasyon para sa mga serbisyo sa pagbuo ng pagsasalita.

Ang XML markup ay responsable para sa pagpapakita ng nilalaman. Fragment ng isang aklat na may naka-embed na audio at larawan maaaring ganito ang hitsura:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html>
<html  
    
    epub_prefix="media: http://idpf.org/epub/vocab/media/#">
    <head>
        <meta charset="utf-8" />
        <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" />
    </head>
    <body>
        <section class="base">
            <h1>the entire transcript</h1>
            <audio id="bgsound" epub_type="media:soundtrack media:background"
                src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop="">
                <div class="errmsg">
                    <p>Your Reading System does not support (this) audio</p>
                </div>
            </audio>

            <p>What does it mean to be human if we don't have a shared culture? What
 does a shared culture mean if we can't share it? It's only in the last
 100, or 150 years or so, that we started tightly restricting how that
 culture gets used.</p>

            <img class="left" src="../images/326261902_3fa36f548d.jpg"
                alt="child against a wall" />
        </section>
    </body>
</html>

Bilang karagdagan sa mga file ng nilalaman, ang archive ay naglalaman ng isang espesyal na dokumento ng nabigasyon (Navigation Document). Inilalarawan nito ang pagkakaayos ng teksto at mga larawan sa isang aklat. Ina-access ito ng mga application ng mambabasa kung nais ng mambabasa na "laktawan" ang ilang mga pahina.

Ang isa pang kinakailangang file sa archive ay package. Kabilang dito ang metadata - impormasyon tungkol sa may-akda, publisher, wika, pamagat, at iba pa. Kasama rin dito ang isang listahan (gulugod) ng mga subsection ng aklat. Maaaring matingnan ang isang halimbawa ng isang pakete ng dokumento sa IDPF repository sa GitHub.

dignidad

Ang bentahe ng format ay ang kakayahang umangkop nito. Binibigyang-daan ka ng EPUB na lumikha ng dynamic na layout ng dokumento na umaangkop sa laki ng screen ng iyong device. Isa ito sa mga pangunahing dahilan kung bakit sinusuportahan ang format ng malaking bilang ng mga mambabasa (at iba pang mga electronic device). Halimbawa, lahat ng ONYX BOOX reader ay gumagana sa EPUB out of the box: mula sa basic at 6-inch caesar 3 hanggang sa premium at 9,7-pulgada Euclid.

Mga elektronikong libro at ang kanilang mga format: pinag-uusapan natin ang tungkol sa EPUB - ang kasaysayan nito, mga kalamangan at kahinaan
/ ONYX BOOX Caesar 3

Dahil ang format ay batay sa mga sikat na pamantayan (XML), madali itong i-convert para sa pagbabasa sa Internet. Sinusuportahan din ng EPUB ang mga interactive na elemento. Oo, umiiral ang mga katulad na elemento sa PDF, ngunit maaari mo lamang itong idagdag sa isang PDF na dokumento gamit ang proprietary software. Sa kaso ng EPUB, idinaragdag ang mga ito sa aklat gamit ang markup at XML tag sa anumang text editor.

Ang isa pang bentahe ng EPUB ay ang mga tampok nito para sa mga taong may problema sa paningin o dyslexia. Pinapayagan ka ng pamantayan na baguhin ang pagpapakita ng teksto sa screen - halimbawa, i-highlight ang ilang mga kumbinasyon ng titik.

Ang EPUB, gaya ng nabanggit na namin, ay nagbibigay ng pagkakataon sa publisher na mag-install ng proteksyon ng kopya. Mga nagbebenta ng e-book kung nais maaaring gamitin kanilang mga mekanismo na naglilimita sa pag-access sa dokumento. Upang gawin ito, kailangan mong baguhin ang rights.xml file sa archive.

Mga hangganan

Upang lumikha ng isang publikasyong EPUB, dapat mong maunawaan ang XML, XHTML, at CSS syntax. Sa kasong ito, kailangan mong magtrabaho kasama ang isang malaking bilang ng mga identifier. Para sa paghahambing, pareho Pamantayan ng FB2 kasama lamang ang minimum na kinakailangang hanay ng mga tag - sapat para sa layout ng fiction. At upang lumikha Mga dokumentong PDF Walang kinakailangang espesyal na kaalaman - ang espesyal na software ay responsable para sa lahat.

Pinuna rin ang EPUB dahil sa pagiging kumplikado ng disenyo ng mga komiks at iba pang mga libro na may maraming mga guhit. Sa kasong ito, ang publisher ay kailangang lumikha ng isang static na layout na may mga nakapirming coordinate para sa bawat larawan - maaari itong tumagal ng maraming pagsisikap at oras.

kung ano ang susunod

Ang IDPF ay kasalukuyang gumagawa ng mga bagong detalye para sa format. Halimbawa, ang isa sa mga ito ay tutulong sa iyo na lumikha ng mga interactive na tutorial na may mga nakatagong seksyon. Magiging iba ang hitsura ng parehong aklat para sa isang guro at isang mag-aaral - sa pangalawang kaso, halimbawa, ang mga sagot sa mga pagsusulit o mga tanong sa pagkontrol ay itatago.

Mga elektronikong libro at ang kanilang mga format: pinag-uusapan natin ang tungkol sa EPUB - ang kasaysayan nito, mga kalamangan at kahinaan
Larawan: Guian Bolisay / CC BY-SA

Inaasahan na ang bagong function ay makakatulong sa muling pagsasaayos ng proseso ng edukasyon. Ngayon, ang EPUB ay medyo aktibong ginagamit ng malalaking unibersidad, halimbawa ang Unibersidad ng Oxford. Ilang taon na ang nakalipas sila idinagdag EPUB 3.0 na suporta sa iyong digital library application.

Gumagawa din ang IDPF ng detalye para sa pagpapatupad ng Open Annotation footnote sa EPUB. Ang pamantayang ito ay binuo ng W3C noong 2013 - pinapasimple nito ang pagtatrabaho sa mga kumplikadong uri ng mga anotasyon. Halimbawa, maaari mo itong gamitin upang magdagdag ng tala sa isang partikular na seksyon ng isang JPEG na imahe. Opsyonal na pamantayan nagpapatupad ng mekanismo pag-synchronize ng mga pagbabago sa mga anotasyon sa pagitan ng mga kopya ng parehong dokumento ng EPUB. Buksan ang Mga Tala sa Format ng Anotasyon maaaring magdagdag sa mga EPUB file kahit ngayon, ngunit ang isang pormal na detalye para sa mga ito ay hindi pa pinagtibay.

Isinasagawa din ang trabaho sa isang bagong bersyon ng pamantayan - EPUB 3.2. Maglalaman ito ng mga format WOFF 2.0 ΠΈ SFNT, na ginagamit upang i-compress ang mga font (sa ilang mga kaso maaari nilang bawasan ang mga laki ng file ng 30%). Papalitan din ng mga developer ang ilang hindi napapanahong katangian ng HTML. Halimbawa, sa halip na isang hiwalay na elemento ng trigger para sa pag-activate ng mga audio at video file, ang bagong pamantayan ay magkakaroon ng mga native na HTML na elemento ng audio at video.

Draft mga pagtutukoy ΠΈ Listahan ng mga pagbabago ay magagamit na sa W3C GitHub repository.

Mga pagsusuri sa mga e-reader ng ONYX-BOOX:

Pinagmulan: www.habr.com

Magdagdag ng komento