Buku elektronik dan formatnya: kita bercakap tentang EPUB - sejarah, kebaikan dan keburukannya

Terdahulu dalam blog kami menulis tentang bagaimana format e-buku muncul Djvu ΠΈ FB2.

Topik artikel hari ini ialah EPUB.

Buku elektronik dan formatnya: kita bercakap tentang EPUB - sejarah, kebaikan dan keburukannya
:ΠžΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅: Nathan Oakley / CC BY

Sejarah format

Pada tahun 90-an, pasaran e-buku dikuasai oleh penyelesaian proprietari. Dan banyak pengeluar e-pembaca mempunyai format mereka sendiri. Contohnya, NuvoMedia menggunakan fail dengan sambungan .rb. Ini adalah bekas dengan fail HTML dan fail .info yang mengandungi metadata. Keadaan ini merumitkan kerja penerbit - mereka terpaksa menaip buku untuk setiap format secara berasingan. Sekumpulan jurutera dari Microsoft, NuvoMedia dan SoftBook Press yang telah disebutkan telah berusaha untuk membetulkan keadaan.

Pada masa itu, Microsoft akan menakluki pasaran e-buku dan sedang membangunkan aplikasi e-pembaca untuk Windows 95. Kita boleh mengatakan bahawa penciptaan format baharu adalah sebahagian daripada strategi perniagaan gergasi IT itu.

Jika kita bercakap tentang NuvoMedia, syarikat ini dianggap sebagai pengeluar pembaca elektronik massa pertama eBook roket. Memori dalaman peranti hanya lapan megabait, dan hayat bateri tidak melebihi 40 jam. Bagi SoftBook Press, mereka juga membangunkan pembaca elektronik. Tetapi peranti mereka mempunyai ciri tersendiri - modem terbina dalam - ia membenarkan anda memuat turun kesusasteraan digital terus dari SoftBookstore.

Pada awal tahun XNUMX-an, kedua-dua syarikat - NuvoMedia dan SoftBook - telah dibeli oleh syarikat media Gemstar dan digabungkan ke dalam Kumpulan eBook Gemstar. Organisasi ini terus menjual pembaca selama beberapa tahun (contohnya, RCA REB 1100) dan buku digital, bagaimanapun pada tahun 2003 keluar dari perniagaan.

Tetapi mari kita kembali kepada pembangunan standard tunggal. Pada tahun 1999, Microsoft, NuvoMedia dan SoftBook Press mengasaskan Forum eBook Terbuka, yang mula bekerja pada draf dokumen yang menandakan permulaan EPUB. Asalnya standard dipanggil OEBPS (singkatan kepada Open EBook Publication Structure). Ia membolehkan untuk mengedarkan penerbitan digital dalam satu fail (arkib ZIP) dan memudahkan untuk memindahkan buku antara platform perkakasan yang berbeza.

Kemudian, syarikat IT Adobe, IBM, HP, Nokia, Xerox dan penerbit McGraw Hill dan Time Warner menyertai Forum eBook Terbuka. Bersama-sama mereka terus membangunkan OEBPS dan membangunkan ekosistem kesusasteraan digital secara keseluruhan. Pada tahun 2005, organisasi itu dinamakan semula sebagai Forum Antarabangsa untuk Penerbitan Digital, atau IDPF.

Pada tahun 2007, IDPF menukar nama format OEBPS kepada EPUB dan mula membangunkan versi keduanya. Ia telah dibentangkan kepada orang ramai pada tahun 2010. Walau bagaimanapun, produk baharu itu hampir tidak berbeza dengan pendahulunya mendapat sokongan grafik vektor dan fon terbina dalam.

Pada masa ini, EPUB telah mengambil alih pasaran dan menjadi standard lalai untuk kebanyakan penerbit dan pengeluar alat elektronik. Format ini telah digunakan oleh O'Reilly dan Cisco Press, serta disokong oleh peranti Apple, Sony, Barnes & Noble dan ONYX BOOX.

Pada tahun 2009, projek Buku Google diumumkan tentang sokongan untuk EPUB - ia telah digunakan untuk mengedarkan lebih daripada sejuta buku percuma. Format mula mendapat populariti di kalangan penulis. Pada tahun 2011, JK Rowling memberitahu tentang rancangan melancarkan laman web Pottermore dan menjadikannya satu-satunya tempat jualan buku Potter dalam bentuk digital.

EPUB dipilih sebagai piawai untuk mengedarkan literatur, terutamanya kerana keupayaannya untuk melaksanakan perlindungan salinan (DRM). Semua buku di kedai dalam talian penulis setakat ini hanya tersedia dalam format ini.

Versi ketiga format EPUB telah dikeluarkan pada tahun 2011. Pembangun telah menambah keupayaan untuk bekerja dengan fail audio dan video serta nota kaki. Hari ini standard terus berkembang - pada 2017 IDPF malah masuk sebahagian daripada konsortium W3C, yang melaksanakan piawaian teknologi untuk World Wide Web.

Cara EPUB berfungsi

Buku dalam format EPUB ialah arkib ZIP. Ia menyimpan teks penerbitan dalam bentuk halaman XHTML atau HTML atau fail PDF. Arkib juga mengandungi kandungan media (audio, video atau imej), fon dan metadata. Ia juga mungkin mengandungi fail tambahan dengan gaya CSS atau PLS-dokumen dengan maklumat untuk perkhidmatan penjanaan pertuturan.

Penanda XML bertanggungjawab untuk memaparkan kandungan. Serpihan buku dengan audio dan imej terbenam mungkin kelihatan seperti ini:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html>
<html  
    
    epub_prefix="media: http://idpf.org/epub/vocab/media/#">
    <head>
        <meta charset="utf-8" />
        <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" />
    </head>
    <body>
        <section class="base">
            <h1>the entire transcript</h1>
            <audio id="bgsound" epub_type="media:soundtrack media:background"
                src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop="">
                <div class="errmsg">
                    <p>Your Reading System does not support (this) audio</p>
                </div>
            </audio>

            <p>What does it mean to be human if we don't have a shared culture? What
 does a shared culture mean if we can't share it? It's only in the last
 100, or 150 years or so, that we started tightly restricting how that
 culture gets used.</p>

            <img class="left" src="../images/326261902_3fa36f548d.jpg"
                alt="child against a wall" />
        </section>
    </body>
</html>

Selain fail kandungan, arkib mengandungi dokumen navigasi khas (Dokumen Navigasi). Ia menerangkan susunan teks dan imej dalam buku. Aplikasi pembaca mengaksesnya jika pembaca ingin "melangkau" beberapa halaman.

Satu lagi fail yang diperlukan dalam arkib ialah pakej. Ia termasuk metadata - maklumat tentang pengarang, penerbit, bahasa, tajuk dan sebagainya. Ia juga termasuk senarai (tulang belakang) subseksyen buku. Contoh dokumen pakej boleh dilihat dalam repositori IDPF di GitHub.

maruah

Kelebihan format ialah fleksibilitinya. EPUB membolehkan anda membuat reka letak dokumen dinamik yang menyesuaikan diri dengan saiz skrin peranti anda. Ini adalah salah satu sebab utama mengapa format ini disokong oleh sebilangan besar pembaca (dan peranti elektronik lain). Contohnya, semua pembaca ONYX BOOX berfungsi dengan EPUB di luar kotak: daripada asas dan 6 inci Caesar 3 sehingga premium dan 9,7 inci Euclid.

Buku elektronik dan formatnya: kita bercakap tentang EPUB - sejarah, kebaikan dan keburukannya
/ ONYX BOOX Caesar 3

Memandangkan format adalah berdasarkan piawaian popular (XML), ia mudah untuk ditukar untuk dibaca di Internet. EPUB juga menyokong elemen interaktif. Ya, unsur serupa wujud dalam PDF, tetapi anda hanya boleh menambahkannya pada dokumen PDF menggunakan perisian proprietari. Dalam kes EPUB, ia ditambahkan pada buku menggunakan markup dan teg XML dalam mana-mana editor teks.

Satu lagi kelebihan EPUB ialah cirinya untuk orang yang mengalami masalah penglihatan atau disleksia. Piawaian membolehkan anda mengubah suai paparan teks pada skrin - contohnya, menyerlahkan gabungan huruf tertentu.

EPUB, seperti yang telah kami nyatakan, memberi peluang kepada penerbit untuk memasang perlindungan salinan. Penjual e-book jika mahu boleh digunakan mekanisme mereka mengehadkan akses kepada dokumen. Untuk melakukan ini, anda perlu mengubah suai fail rights.xml dalam arkib.

Kecacatan

Untuk membuat penerbitan EPUB, anda mesti memahami sintaks XML, XHTML dan CSS. Dalam kes ini, anda perlu bekerja dengan sejumlah besar pengecam. Sebagai perbandingan, sama FB2 standard termasuk hanya set teg minimum yang diperlukan - mencukupi untuk susun atur fiksyen. Dan untuk mencipta dokumen PDF Tiada pengetahuan khusus diperlukan sama sekali - perisian khusus bertanggungjawab untuk segala-galanya.

EPUB juga dikritik kerana kerumitan reka bentuk komik dan buku lain dengan banyak ilustrasi. Dalam kes ini, penerbit perlu membuat reka letak statik dengan koordinat tetap untuk setiap imej - ini boleh mengambil banyak usaha dan masa.

Apa yang Seterusnya

IDPF sedang mengusahakan spesifikasi baharu untuk format tersebut. Sebagai contoh, salah satu daripadanya akan membantu anda membuat tutorial interaktif dengan bahagian tersembunyi. Buku yang sama akan kelihatan berbeza untuk guru dan pelajar - dalam kes kedua, sebagai contoh, jawapan kepada ujian atau soalan kawalan akan disembunyikan.

Buku elektronik dan formatnya: kita bercakap tentang EPUB - sejarah, kebaikan dan keburukannya
:ΠžΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅: Guian Bolisay / CC BY-SA

Diharapkan fungsi baharu itu akan membantu menyusun semula proses pendidikan. Hari ini, EPUB agak aktif digunakan oleh universiti besar, contohnya Universiti Oxford. Beberapa tahun lalu mereka tambah Sokongan EPUB 3.0 dalam aplikasi perpustakaan digital anda.

IDPF juga sedang mencipta spesifikasi untuk melaksanakan nota kaki Anotasi Terbuka dalam EPUB. Piawaian ini telah dibangunkan oleh W3C pada tahun 2013 - ia memudahkan kerja dengan jenis anotasi yang kompleks. Sebagai contoh, anda boleh menggunakannya untuk menambah nota pada bahagian tertentu imej JPEG. Standard pilihan melaksanakan mekanisme tersebut menyegerakkan perubahan dalam anotasi antara salinan dokumen EPUB yang sama. Buka Nota Format Anotasi boleh tambah ke dalam fail EPUB walaupun sekarang, tetapi spesifikasi rasmi untuk mereka masih belum diterima pakai.

Kerja-kerja juga sedang dijalankan pada versi baharu standard - EPUB 3.2. Ia akan mengandungi format WOFF 2.0 ΠΈ SFNT, yang digunakan untuk memampatkan fon (dalam beberapa kes ia boleh mengurangkan saiz fail sebanyak 30%). Pembangun juga akan menggantikan beberapa atribut HTML yang sudah lapuk. Sebagai contoh, bukannya elemen pencetus yang berasingan untuk mengaktifkan fail audio dan video, standard baharu akan mempunyai elemen audio dan video HTML asli.

Draf spesifikasi ΠΈ Senarai perubahan sudah tersedia dalam repositori W3C GitHub.

Ulasan tentang e-readers ONYX-BOOX:

Sumber: www.habr.com

Tambah komen