E-buku dan formatnya: FB2 dan FB3 - sejarah, kebaikan, keburukan dan prinsip kerja

Dalam artikel sebelum ini kita bercakap tentang ciri format DjVu. Hari ini kami memutuskan untuk menumpukan pada format FictionBook2, lebih dikenali sebagai FB2, dan "penggantinya" FB3.

E-buku dan formatnya: FB2 dan FB3 - sejarah, kebaikan, keburukan dan prinsip kerja
/Flickr/ Judit Klein / CC

Kemunculan format

Pada pertengahan 90-an, peminat kami mula mendigitalkan buku Soviet. Mereka menterjemah dan memelihara kesusasteraan dalam pelbagai format. Salah satu perpustakaan pertama di Runet - Perpustakaan Maxim Moshkov - menggunakan fail teks berformat (TXT).

Pilihan dibuat memihak kepadanya kerana penentangannya terhadap rasuah bait dan serba boleh - TXT dibuka pada mana-mana sistem pengendalian. Namun, dia menyusahkan pemprosesan maklumat teks yang disimpan. Sebagai contoh, untuk beralih ke baris keseribu, 999 baris mendahuluinya perlu diproses. Buku juga disimpan dalam dokumen Word dan PDF - yang terakhir sukar untuk ditukar kepada format lain, dan komputer yang lemah dibuka dan dipaparkan Dokumen PDF dengan kelewatan.

HTML juga digunakan untuk "menyimpan" kesusasteraan elektronik. Ia menjadikan pengindeksan, penukaran kepada format lain dan penciptaan dokumen (teks penandaan) lebih mudah, tetapi ia memperkenalkan kelemahannya sendiri. Salah satu yang paling penting ialah "kekaburanΒ» standard: ia membenarkan kebebasan tertentu semasa menulis tag. Sebahagian daripada mereka terpaksa ditutup, yang lain (contohnya, ) - tidak perlu menutupnya. Teg itu sendiri boleh mempunyai susunan bersarang sewenang-wenangnya.

Dan walaupun kerja sedemikian dengan fail tidak digalakkan - dokumen sedemikian dianggap tidak betul - standard memerlukan pembaca untuk cuba memaparkan kandungan. Di sinilah kesukaran timbul, kerana dalam setiap aplikasi proses "meneka" dilaksanakan dengan caranya sendiri. Pada masa yang sama, peranti membaca dan aplikasi yang terdapat di pasaran pada masa itu faham satu atau dua format khusus. Jika buku tersedia dalam satu format, ia perlu diformat semula untuk dibaca. Ia bertujuan untuk menyelesaikan semua kekurangan ini Buku Fiksyen2, atau FB2, yang mengambil alih "penyikatan" awal teks dan penukaran.

Ambil perhatian bahawa format mempunyai versi pertama - Buku Fiksyen1 - walau bagaimanapun, ia hanya bersifat eksperimen, tidak bertahan lama, pada masa ini tidak disokong dan tidak serasi ke belakang. Oleh itu, FictionBook paling kerap bermaksud "penggantinya" - format FB2.

FB2 dicipta oleh sekumpulan pembangun yang diketuai oleh Dmitry Gribov, yang merupakan pengarah teknikal syarikat liter, dan Mikhail Matsnev, pencipta Haali Reader. Format ini berdasarkan XML, yang mengawal kerja dengan teg tidak tertutup dan bersarang lebih ketat daripada HTML. Dokumen XML disertakan dengan apa yang dipanggil Skema XML. Skema XML ialah fail khas yang mengandungi semua teg dan menerangkan peraturan untuk kegunaannya (urutan, bersarang, mandatori dan pilihan, dsb.). Dalam Buku Fiksyen, gambar rajah berada dalam fail Buku Fiksyen2.xsd. Contoh skema XML boleh didapati di pautan (ia digunakan oleh kedai e-buku liters).

Struktur dokumen FB2

Teks dalam dokumen disimpan dalam tag khas - unsur jenis perenggan: , Dan . Terdapat juga unsur , yang tidak mempunyai kandungan dan digunakan untuk memasukkan jurang.

Semua dokumen bermula dengan teg akar , di bawah yang mungkin muncul , , Dan .

Tag mengandungi helaian gaya untuk memudahkan penukaran kepada format lain. DALAM pembohongan dikodkan menggunakan base64 data yang mungkin diperlukan untuk membuat dokumen.

unsur mengandungi semua maklumat yang diperlukan tentang buku: genre karya, senarai pengarang (nama penuh, alamat e-mel dan laman web), tajuk, blok dengan kata kunci, anotasi. Ia juga mungkin mengandungi maklumat tentang perubahan yang dibuat pada dokumen dan maklumat tentang penerbit buku jika ia diterbitkan di atas kertas.

Beginilah rupa bahagian blok itu dalam entri Buku Fiksyen untuk kerja-kerja "A Study in Scarlet" oleh Arthur Conan Doyle, diambil dari Projek Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Komponen utama dokumen Buku Fiksyen ialah . Ia mengandungi teks buku itu sendiri. Terdapat beberapa teg ini di seluruh dokumen - blok tambahan digunakan untuk menyimpan nota kaki, ulasan dan nota.

FictionBook juga menyediakan beberapa tag untuk bekerja dengan hiperpautan. Mereka berdasarkan spesifikasi XLink, dibangunkan oleh konsortium W3C khusus untuk mencipta pautan antara sumber yang berbeza dalam dokumen XML.

Kelebihan format

Piawaian FB2 hanya merangkumi set teg minimum yang diperlukan (mencukupi untuk "reka bentuk" fiksyen), yang memudahkan pemprosesannya oleh pembaca. Lebih-lebih lagi, dalam kes kerja langsung pembaca dengan format FB, pengguna mempunyai peluang untuk menyesuaikan hampir semua parameter paparan.

Struktur dokumen yang ketat membolehkan anda mengautomasikan proses penukaran daripada format FB kepada mana-mana yang lain. Struktur yang sama memungkinkan untuk bekerja dengan elemen individu dokumen - sediakan penapis oleh pengarang buku, tajuk, genre, dll. Atas sebab ini, format FB2 telah mendapat populariti di Runet, menjadi standard lalai dalam perpustakaan dan perpustakaan elektronik Rusia di negara-negara CIS.

Kelemahan format

Kesederhanaan format FB2 adalah kelebihan dan kekurangannya pada masa yang sama. Ini mengehadkan kefungsian untuk susun atur teks yang kompleks (contohnya, nota dalam jidar). Ia tidak mempunyai grafik vektor atau sokongan untuk senarai bernombor. Atas sebab ini format tak sesuai sangat untuk buku teks, buku rujukan dan kesusasteraan teknikal (nama format juga bercakap tentang ini - buku fiksyen, atau "buku fiksyen").

Pada masa yang sama, untuk memaparkan maklumat minimum tentang buku - tajuk, pengarang dan kulit - program perlu memproses hampir keseluruhan dokumen XML. Ini kerana metadata datang pada permulaan teks dan imej datang pada akhir.

FB3 - pembangunan format

Disebabkan peningkatan keperluan untuk memformat teks buku (dan untuk mengurangkan beberapa kelemahan FB2), Gribov mula bekerja pada format FB3. Pembangunan kemudian berhenti, tetapi pada tahun 2014 ia adalah disambung semula.

Menurut penulis, mereka mengkaji keperluan sebenar apabila menerbitkan kesusasteraan teknikal, melihat buku teks, buku rujukan, manual dan menggariskan set tag yang lebih khusus yang membolehkan mana-mana buku dipaparkan.

Dalam spesifikasi baharu, format Buku Fiksyen ialah arkib zip di mana metadata, imej dan teks disimpan sebagai fail berasingan. Keperluan untuk format fail zip dan konvensyen untuk organisasinya dinyatakan dalam standard ECMA-376, yang mentakrifkan Open XML.

Beberapa penambahbaikan telah dibuat berkaitan pemformatan (jarak, garis bawah) dan objek baharu telah ditambah - "blok" - yang memformatkan serpihan sewenang-wenangnya buku dalam bentuk segi empat dan boleh dibenamkan dalam teks dengan sampul. Kini terdapat sokongan untuk senarai bernombor dan bertitik tumpu.

FB3 diedarkan di bawah lesen percuma dan sumber terbuka, jadi semua utiliti tersedia untuk penerbit dan pengguna: penukar, penyunting awan, pembaca. semasa versi itu format, pembaca ΠΈ editor itu boleh didapati dalam repositori GitHub projek.

Secara umum, FictionBook3 masih kurang meluas berbanding abangnya, tetapi beberapa perpustakaan elektronik sudah menawarkan buku dalam format ini. Dan liter beberapa tahun lalu mengumumkan hasrat mereka untuk memindahkan keseluruhan katalog mereka ke format baharu. Sesetengah pembaca sudah menyokong semua fungsi FB3 yang diperlukan. Sebagai contoh, semua model moden pembaca ONYX boleh berfungsi dengan format ini di luar kotak, contohnya, Darwin 3 atau Cleopatra 3.

E-buku dan formatnya: FB2 dan FB3 - sejarah, kebaikan, keburukan dan prinsip kerja
/ ONYX BOOX Cleopatra 3

Pengedaran FictionBook3 yang lebih meluas akan mewujudkan ekosistem berorientasikan untuk bekerja sepenuhnya dan berkesan dengan teks pada mana-mana peranti dengan sumber terhad: paparan hitam-putih atau kecil, memori rendah, dsb. Menurut pembangun, buku yang telah dibentangkan akan menjadi semudah mungkin dalam sebarang persekitaran.

PS Kami membawa kepada perhatian anda beberapa ulasan tentang pembaca ONYX BOOX:



Sumber: www.habr.com

Tambah komen