E-book dan formatnya: FB2 dan FB3 - sejarah, pro, kontra, dan prinsip kerja

Pada artikel sebelumnya, kita telah membicarakannya fitur format DjVu. Hari ini kami memutuskan untuk fokus pada format FictionBook2, lebih dikenal sebagai FB2, dan FB3 "penerusnya".

E-book dan formatnya: FB2 dan FB3 - sejarah, pro, kontra, dan prinsip kerja
/flickr/ Judith Klein / CC

Penampilan format

Pada pertengahan 90-an, peminat Kami mulai mendigitalkan buku-buku Soviet. Mereka menerjemahkan dan melestarikan lektur dalam berbagai format. Salah satu perpustakaan pertama di Runet - Perpustakaan Maxim Moshkov β€” menggunakan file teks yang diformat (.txt).

Pilihan yang menguntungkannya dibuat karena resistensi terhadap korupsi byte dan keserbagunaan - TXT terbuka di sistem operasi apa pun. Namun, dia terhalang memproses informasi teks yang disimpan. Misalnya, untuk berpindah ke baris keseribu, Anda harus memproses 999 baris sebelumnya. Buku juga disimpan dalam dokumen "Word" dan PDF - yang terakhir sulit untuk dikonversi ke format lain, dan komputer yang lemah dibuka dan ditampilkan Dokumen PDF dengan penundaan.

HTML juga digunakan untuk "menyimpan" literatur elektronik. Itu menyederhanakan pengindeksan, mengonversi ke format lain, dan membuat dokumen (menandai teks), tetapi memperkenalkan kekurangannya sendiri. Salah satu yang paling signifikan adalahketidakjelasanΒ» standar: dia mengizinkan kebebasan tertentu saat menulis tag. Beberapa dari mereka harus ditutup, yang lain (misalnya, ) - tidak perlu ditutup. Tag itu sendiri dapat memiliki urutan bersarang yang berubah-ubah.

Dan meskipun pekerjaan dengan file seperti itu tidak dianjurkan - dokumen semacam itu dianggap salah - standar mengharuskan pembaca untuk mencoba menampilkan konten. Di sinilah kesulitan muncul, karena dalam setiap penerapan proses β€œberpikir” diterapkan dengan caranya sendiri-sendiri. Pada saat yang sama, perangkat dan aplikasi untuk membaca tersedia di pasaran saat itu dipahami satu atau dua format khusus. Jika buku tersedia dalam satu format, itu harus diformat ulang agar dapat dibaca. Untuk mengatasi semua kekurangan ini dan dipanggil Buku Fiksi2, atau FB2, yang mengambil alih "penyisiran" awal teks dan konversi.

Perhatikan bahwa formatnya memiliki versi pertama βˆ’ Buku Fiksi1 - namun, itu hanya percobaan, tidak bertahan lama, saat ini tidak didukung dan tidak kompatibel ke belakang. Oleh karena itu, FictionBook paling sering berarti "pengikut" - format FB2.

FB2 dibuat oleh tim pengembangan yang dipimpin oleh Dmitry Gribov, yang merupakan direktur teknis perusahaan liter, dan Mikhail Matsnev, pencipta Haali Reader. Formatnya didasarkan pada XML, yang lebih ketat daripada HTML dalam mengatur pekerjaan dengan tag terbuka dan bersarang. Dokumen XML disertai dengan apa yang disebut skema XML. Skema XML adalah file khusus yang berisi semua tag dan menjelaskan aturan penggunaannya (urutan, bersarang, wajib dan opsional, dll.). Di FictionBook, skemanya ada di file FictionBook2.xsd. Contoh skema XML dapat ditemukan di link (ini digunakan oleh toko e-book liter).

Struktur Dokumen FB2

Teks dalam dokumen disimpan dalam tag khusus - elemen jenis paragraf: , Dan . Ada juga elemen , yang tidak memiliki konten dan digunakan untuk menyisipkan celah.

Semua dokumen dimulai dengan tag root , di bawah mana , , Dan .

Menandai berisi style sheet untuk memfasilitasi konversi ke format lain. DI DALAM berbohong dikodekan dengan base64 data yang mungkin diperlukan untuk merender dokumen.

Elemen berisi semua informasi yang diperlukan tentang buku: genre karya, daftar penulis (nama lengkap, alamat email, dan situs web di Internet), judul, blok dengan kata kunci, anotasi. Mungkin juga berisi informasi tentang perubahan yang dilakukan pada dokumen dan informasi tentang penerbit buku, jika diterbitkan di atas kertas.

Ini penampakan bloknya dalam entri Buku Fiksi untuk bekerja "Study in Scarlet" oleh Arthur Conan Doyle, diambil dari Proyek Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Komponen kunci dari dokumen FictionBook adalah . Ini berisi teks sebenarnya dari buku tersebut. Mungkin ada beberapa tag ini di seluruh dokumen - blok tambahan digunakan untuk menyimpan catatan kaki, komentar, dan catatan.

FictionBook juga menyediakan beberapa tag untuk menangani hyperlink. Mereka didasarkan pada spesifikasi xLinkdikembangkan oleh konsorsium W3C khusus untuk membuat tautan antara berbagai sumber daya dalam dokumen XML.

Kelebihan formatnya

Standar FB2 hanya mencakup kumpulan tag minimum yang diperlukan (cukup untuk "hiasan" fiksi), yang menyederhanakan pemrosesannya oleh pembaca. Selain itu, dalam hal pembaca langsung bekerja dengan format FB, pengguna mendapat kesempatan untuk menyesuaikan hampir semua parameter tampilan.

Struktur dokumen yang ketat memungkinkan Anda mengotomatiskan proses konversi dari format FB ke format lainnya. Struktur yang sama memungkinkan untuk bekerja dengan elemen dokumen individual - untuk mengatur filter berdasarkan penulis buku, judul, genre, dll. Karena alasan ini, format FB2 mendapatkan popularitas di Runet, menjadi standar default di perpustakaan elektronik Rusia dan perpustakaan negara-negara CIS.

Kekurangan Formasi

Kesederhanaan format FB2 adalah kelebihan dan kekurangannya pada saat yang bersamaan. Ini membatasi fungsionalitas untuk tata letak teks yang rumit (misalnya, catatan pinggir). Itu tidak memiliki grafik vektor dan dukungan untuk daftar bernomor. Untuk alasan ini, format sangat tidak cocok untuk buku teks, buku referensi, dan literatur teknis (bahkan nama formatnya sendiri mengatakan ini - buku fiksi, atau "buku fiksi").

Pada saat yang sama, untuk menampilkan informasi minimum tentang buku - judul, penulis, dan sampul - program perlu memproses hampir seluruh dokumen XML. Ini karena metadata ada di awal teks dan gambar ada di akhir.

FB3 - pengembangan format

Sehubungan dengan meningkatnya persyaratan untuk memformat teks buku (dan untuk meratakan beberapa kekurangan FB2), Gribov mulai mengerjakan format FB3. Pengembangan selanjutnya berhenti, tetapi pada tahun 2014 dilanjutkan.

Menurut penulis, mereka mempelajari kebutuhan nyata dalam publikasi literatur teknis, melihat buku teks, buku referensi, manual, dan menguraikan serangkaian tag yang lebih spesifik yang memungkinkan buku apa pun ditampilkan.

Dalam spesifikasi baru, format Buku Fiksi adalah arsip zip yang menyimpan metadata, gambar, dan teks dalam file terpisah. Persyaratan untuk format file zip dan konvensi untuk pengaturannya dijabarkan dalam standar ECMA-376Yang mendefinisikan Open XML.

Sejumlah perbaikan telah dilakukan terkait pemformatan (spasi, garis bawah) dan objek baru ditambahkan - "blok" - yang membentuk fragmen buku yang berubah-ubah dalam bentuk segi empat dan dapat disematkan dalam teks dengan pembungkus. Menambahkan dukungan untuk daftar bernomor dan berpoin.

FB3 didistribusikan di bawah lisensi gratis dan memiliki kode sumber terbuka, sehingga semua utilitas tersedia untuk penerbit dan pengguna: konverter, editor cloud, pembaca. saat ini versi format, ruang baca ΠΈ editornya dapat ditemukan di repositori proyek di GitHub.

Secara umum, FictionBook3 masih kurang umum dibandingkan kakaknya, namun buku dengan format ini sudah ditawarkan oleh beberapa perpustakaan elektronik. Dan beberapa tahun lalu, liter mengumumkan niatnya untuk mentransfer seluruh katalognya ke format baru. Beberapa pembaca sudah mendukung semua fungsionalitas FB3 yang diperlukan. Misalnya, semua model pembaca ONYX modern dapat bekerja dengan format ini di luar kotak, misalnya, Darwin 3 ΠΈΠ»ΠΈ Cleopatra 3.

E-book dan formatnya: FB2 dan FB3 - sejarah, pro, kontra, dan prinsip kerja
/ ONYX BOOX Cleopatra 3

Distribusi FictionBook3 yang lebih luas akan menciptakan ekosistem yang berorientasi untuk pekerjaan penuh dan efektif dengan teks pada perangkat apa pun dengan sumber daya terbatas: layar hitam putih atau kecil, memori rendah, dll. Menurut pengembang, buku yang pernah ditata akan senyaman mungkin di lingkungan apa pun.

PS Kami menyampaikan kepada Anda beberapa ulasan tentang pembaca ONYX BOOX:



Sumber: www.habr.com

Tambah komentar