E-buku lan format: FB2 lan FB3 - sajarah, pro, cons lan prinsip karya

Ing artikel sadurunge kita ngomong babagan fitur saka format DjVu. Dina iki kita mutusake kanggo fokus ing format FictionBook2, luwih dikenal minangka FB2, lan "penerus" FB3.

E-buku lan format: FB2 lan FB3 - sajarah, pro, cons lan prinsip karya
/flickr/ Judit Klein / CC

Tampilan format

Ing pertengahan 90s, penggemar diwiwiti digitalisasi buku Soviet. Padha nerjemahake lan ngreksa sastra ing macem-macem format. Salah sawijining perpustakaan pisanan ing Runet - Pustaka Maxim Moshkov - digunakake file teks format (TXT).

Pilihan digawe ing sih amarga resistance kanggo korupsi byte lan versatility - TXT mbukak ing sembarang sistem operasi. Nanging, dheweke digawe angel pangolahan informasi teks sing disimpen. Contone, kanggo pindhah menyang baris sewu, 999 baris sadurunge kudu diproses. Buku uga disimpen ing dokumen Word lan PDF - sing terakhir angel diowahi menyang format liyane, lan komputer sing ringkih dibukak lan ditampilake Dokumen PDF kanthi telat.

HTML uga digunakake kanggo "nyimpen" literatur elektronik. Iki nggawe indeksasi, konversi menyang format liyane, lan nggawe dokumen (teks menehi tag) luwih gampang, nanging ngenalake kekurangane dhewe. Salah sawijining sing paling penting yaiku "samar-samarΒ»standar: ngidini kabebasan tartamtu nalika nulis tag. Sawetara kudu ditutup, liyane (contone, ) - ora perlu ditutup. Tag kasebut bisa duwe urutan nesting sing sewenang-wenang.

Lan sanajan karya karo file kasebut ora disaranake - dokumen kasebut dianggep salah - standar sing dibutuhake para pamaca kanggo nyoba nampilake konten kasebut. Ing kene ana kangelan, amarga ing saben aplikasi proses "guessing" wis dileksanakake ing cara dhewe. Ing wektu sing padha, piranti maca lan aplikasi sing kasedhiya ing pasar nalika iku mangertos siji utawa loro format khusus. Yen buku kasedhiya ing siji format, kudu diformat maneh supaya bisa diwaca. Iki dimaksudake kanggo ngatasi kabeh kekurangan kasebut Buku Fiksi2, utawa FB2, sing njupuk alih "combing" awal teks lan konversi.

Elinga yen format kasebut duwe versi pisanan - Buku Fiksi1 - Nanging, iki mung eksperimen, ora tahan suwe, saiki ora didhukung lan ora kompatibel karo mundur. Mulane, FictionBook paling asring tegese "penerus" - format FB2.

FB2 digawe dening klompok pangembang sing dipimpin dening Dmitry Gribov, sing dadi direktur teknis perusahaan liter, lan Mikhail Matsnev, pangripta Haali Reader. Format kasebut adhedhasar XML, sing ngatur karya karo tag sing ora ditutup lan nested luwih ketat tinimbang HTML. Dokumen XML diiringi Skema XML sing disebut. Skema XML minangka file khusus sing ngemot kabeh tag lan nerangake aturan sing digunakake (urutan, nesting, wajib lan opsional, lsp.). Ing FictionBook, diagram kasebut ana ing file FictionBook2.xsd. Conto skema XML bisa ditemokake ing link (iki digunakake dening toko e-buku liter).

Struktur dokumen FB2

Teks ing dokumen dijaga ing tag khusus - unsur jinis paragraf: , lan . Ana uga unsur , sing ora ana isi lan digunakake kanggo nglebokake kesenjangan.

Kabeh dokumen diwiwiti kanthi tag root , ing ngisor sing bisa katon , , lan .

Tag ngemot lembar gaya kanggo nggampangake konversi menyang format liyane. ING ngapusi dienkode nggunakake base64 data sing bisa dibutuhake kanggo nerjemahake dokumen kasebut.

unsur ngemot kabeh informasi sing dibutuhake babagan buku: genre karya, dhaptar penulis (jeneng lengkap, alamat email lan situs web), judhul, blokir kanthi tembung kunci, anotasi. Bisa uga ngemot informasi babagan owah-owahan ing dokumen lan informasi babagan penerbit buku kasebut yen diterbitake ing kertas.

Iki minangka bagΓ©an saka blok kasebut ing entri FictionBook kanggo nyambut gawe "A Study in Scarlet" dening Arthur Conan Doyle, dijupuk saka Proyek Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Komponen kunci saka dokumen FictionBook yaiku . Isine teks buku kasebut dhewe. Bisa uga ana sawetara tag kasebut ing saindhenging dokumen - pamblokiran tambahan digunakake kanggo nyimpen cathetan kaki, komentar lan cathetan.

FictionBook uga nyedhiyakake sawetara tag kanggo nggarap hyperlink. Padha adhedhasar specification XLink, dikembangake dening konsorsium W3C khusus kanggo nggawe pranala antarane sumber daya beda ing dokumen XML.

Kaluwihan saka format

Standar FB2 mung kalebu set tag minimal sing dibutuhake (cukup kanggo "ngrancang" fiksi), sing nyederhanakake pangolahan dening para pembaca. Kajaba iku, ing kasus operasi langsung saka maca kanthi format FB, pangguna duwe kesempatan kanggo ngatur meh kabeh paramèter tampilan.

Struktur dokumen sing ketat ngidini sampeyan ngotomatisasi proses konversi saka format FB menyang liyane. Struktur padha ndadekake iku bisa kanggo nggarap unsur individu saka dokumen - nyiyapake saringan dening penulis buku, judhul, genre, etc. Mulane, format FB2 wis gained popularitas ing Runet, dadi standar standar ing perpustakaan elektronik Rusia lan perpustakaan ing negara CIS.

Cacat saka format

Kesederhanaan format FB2 minangka kauntungan lan kerugian ing wektu sing padha. Iki mbatesi fungsi kanggo tata letak teks sing kompleks (contone, cathetan ing pinggir). Ora duwe grafis vektor utawa dhukungan kanggo dhaptar nomer. Kanggo alasan iki format ora cocok banget kanggo buku teks, buku referensi lan literatur teknis (jeneng format malah ngomong babagan iki - buku fiksi, utawa "buku fiksi").

Ing wektu sing padha, kanggo nampilake informasi minimal babagan buku - judhul, penulis lan tutup - program kudu ngolah meh kabeh dokumen XML. Iki amarga metadata teka ing awal teks lan gambar teka ing pungkasan.

FB3 - pangembangan format

Amarga tambah syarat kanggo ngowahi format teks buku (lan kanggo ngurangi sawetara kekurangan FB2), Gribov wiwit nggarap format FB3. Pembangunan banjur mandheg, nanging ing 2014 diterusake.

Miturut penulis, dheweke sinau kabutuhan nyata nalika nerbitake literatur teknis, ndeleng buku teks, buku referensi, manual lan njlentrehake tag sing luwih spesifik sing ngidini buku apa wae ditampilake.

Ing spesifikasi anyar, format FictionBook minangka arsip zip ing ngendi metadata, gambar lan teks disimpen minangka file sing kapisah. Keperluan kanggo format file zip lan konvensi kanggo organisasi kasebut ditemtokake ing standar kasebut ECMA-376, sing nemtokake Open XML.

Sawetara dandan digawe ana hubungane karo format (spasi, garis ngisor) lan obyek anyar ditambahake - "blok" - sing ngowahi format fragmen buku kanthi sewenang-wenang kanthi bentuk kuadrat lan bisa diselehake ing teks kanthi bungkus. Saiki ana dhukungan kanggo dhaptar nomer lan bullet.

FB3 disebarake ing sangisore lisensi gratis lan mbukak sumber, saengga kabeh utilitas kasedhiya kanggo penerbit lan pangguna: konverter, editor awan, pembaca. saiki versi format, maca ΠΈ editor bisa ditemokake ing repositori GitHub proyek.

UmumΓ©, FictionBook3 isih kurang nyebar tinimbang sedulur tuwa, nanging sawetara perpustakaan elektronik wis nawakake buku kanthi format iki. Lan liter sawetara taun kepungkur ngumumake niat kanggo nransfer kabeh katalog menyang format anyar. Sawetara pembaca wis ndhukung kabeh fungsi FB3 sing dibutuhake. Contone, kabeh model modern saka pamaca ONYX bisa nganggo format iki metu saka kothak, contone, Darwin 3 utawa Cleopatra 3.

E-buku lan format: FB2 lan FB3 - sajarah, pro, cons lan prinsip karya
/ ONYX BOOX Cleopatra 3

Distribusi FictionBook3 sing luwih akeh bakal nggawe ekosistem berorientasi kanthi lengkap lan efektif nggarap teks ing piranti apa wae kanthi sumber daya sing winates: tampilan ireng-putih utawa cilik, memori kurang, lan sapiturute.

PS Kita menehi perhatian marang sawetara review babagan para pamaca ONYX BOOX:



Source: www.habr.com

Add a comment