E-buku sareng formatna: FB2 sareng FB3 - sajarah, pro, kontra sareng prinsip operasi

Dina artikel saméméhna urang ngobrol ngeunaan fitur tina format DjVu. Dinten ieu kami mutuskeun pikeun museurkeun kana format FictionBook2, anu langkung dikenal salaku FB2, sareng "panerusna" FB3.

E-buku sareng formatna: FB2 sareng FB3 - sajarah, pro, kontra sareng prinsip operasi
/flickr/ Judit Klein / CC

Penampilan formatna

Dina pertengahan 90an, peminat dimimitian digitize buku Soviét. Aranjeunna narjamahkeun sareng ngawétkeun literatur dina rupa-rupa format. Salah sahiji perpustakaan munggaran di Runet - Perpustakaan Maxim Moshkov - dipaké file téks formatna (TXT).

Pilihan ieu dilakukeun dina kahadean na kusabab résistansi kana korupsi bait sareng versatility - TXT dibuka dina sistem operasi naon waé. Sanajan kitu, anjeunna dijieun hésé ngolah informasi téks nu disimpen. Contona, pikeun pindah ka garis sarébu, 999 garis saméméh éta kudu diolah. Buku ogé disimpen dina dokumén Kecap sarta PDF - dimungkinkeun éta hésé pikeun ngarobah kana format sejen, sarta komputer lemah dibuka tur dipintonkeun Dokumén PDF sareng telat.

HTML ieu ogé dipaké pikeun "nyimpen" literatur éléktronik. Éta ngajantenkeun indéks, konvérsi kana format anu sanés, sareng nyiptakeun dokumén (tag téks) langkung gampang, tapi ngenalkeun kakuranganana sorangan. Salah sahiji anu paling penting nyaéta "samar-samar» standar: eta diwenangkeun liberties tangtu nalika nulis tag. Sababaraha di antarana kudu ditutup, batur (contona, ) - teu perlu nutup eta. Tag sorangan bisa boga urutan nyarang sawenang.

Sareng sanaos padamelan sapertos kitu sareng file henteu didorong - dokumén sapertos kitu dianggap lepat - standar ngabutuhkeun pamiarsa pikeun nyobian ningalikeun eusina. Ieu dimana kasusah timbul, sabab dina unggal aplikasi prosés "guessing" dilaksanakeun dina cara sorangan. Dina waktos anu sami, alat maca sareng aplikasi anu sayogi di pasar dina waktos éta ngarti hiji atawa dua format husus. Upami buku sayogi dina hiji format, éta kedah diformat deui supados tiasa dibaca. Ieu dimaksudkeun pikeun ngajawab sakabéh shortcomings ieu Buku Fiksi2, atanapi FB2, anu ngambil alih "combing" awal téks sareng konvérsi.

Catet yén formatna ngagaduhan versi munggaran - Buku Fiksi1 - kumaha oge, éta ngan ékspérimén di alam, teu lepas lila, ayeuna teu didukung tur teu cocog mundur. Ku alatan éta, FictionBook paling sering hartosna "panerusna" - format FB2.

FB2 dijieun ku grup pamekar dipingpin ku Dmitry Gribov, Anu diréktur téknis perusahaan liter, sareng Mikhail Matsnev, pencipta Haali Reader. Formatna dumasar kana XML, nu ngatur gawé kalawan tag unclosed tur nested leuwih ketat ti HTML. Dokumén XML dipirig ku anu disebut Skéma XML. Skéma XML mangrupikeun file khusus anu ngandung sadaya tag sareng ngajelaskeun aturan pikeun dianggo (runtuyan, nyarang, wajib sareng pilihan, jsb.). Dina FictionBook, diagramna aya dina file FictionBook2.xsd. Hiji conto schema XML bisa kapanggih di link (éta dianggo ku toko e-buku liter).

Struktur dokumén FB2

Téks dina dokumén disimpen dina tag khusus - unsur jinis paragraf: , Jeung . Aya ogé unsur , nu teu boga eusi jeung dipaké pikeun nyelapkeun sela.

Sadaya dokumén dimimitian ku tag root , di handap nu bisa muncul , , Jeung .

Tag ngandung lambaran gaya pikeun ngagampangkeun konversi kana format anu sanés. DI bohong disandikeun maké dasar64 data nu bisa diperlukeun pikeun rendering dokumén.

unsur ngandung sagala informasi diperlukeun ngeunaan buku: genre karya, daptar pangarang (ngaran lengkep, alamat surélék tur ramatloka), judul, blok jeung kecap konci, annotation. Éta ogé tiasa ngandung émbaran ngeunaan parobihan anu dilakukeun kana dokumén sareng inpormasi ngeunaan penerbit buku upami éta diterbitkeun dina kertas.

Ieu naon bagian tina blok Sigana mah dina Éntri FictionBook pikeun jalan "A Study in Scarlet" ku Arthur Conan Doyle, dicokot tina Proyék Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Komponén konci dokumén FictionBook nyaéta . Ieu ngandung téks buku sorangan. Bisa aya sababaraha tag ieu sapanjang dokumén - blok tambahan dipaké pikeun nyimpen footnotes, komentar jeung catetan.

FictionBook ogé nyayogikeun sababaraha tag pikeun damel sareng hyperlink. Éta dumasar kana spésifikasi XLink, dikembangkeun ku konsorsium W3C husus pikeun nyieun tumbu antara sumberdaya béda dina dokumén XML.

Kaunggulan tina format

Standar FB2 ngawengku ukur set minimum diperlukeun tina tag (cukup pikeun "desain" fiksi), nu simplifies processing na ku pamiarsa. Sumawona, dina kasus operasi langsung pamaca kalayan format FB, pangguna ngagaduhan kasempetan pikeun ngarobih ampir sadaya parameter tampilan.

Struktur dokumen anu ketat ngamungkinkeun anjeun pikeun ngajadikeun otomatis prosés konvérsi tina format FB ka anu sanés. Struktur sarua ngamungkinkeun pikeun digawekeun ku elemen individu dokumén - nyetél saringan ku pangarang buku, judul, genre, jsb Ku sabab kitu, format FB2 geus miboga popularitas di Runet, jadi standar standar di perpustakaan éléktronik Rusia jeung perpustakaan. di nagara CIS.

Kalemahan format

Kesederhanaan format FB2 mangrupikeun kaunggulan sareng kalemahan dina waktos anu sami. Ieu ngawatesan pungsionalitas pikeun perenah téks kompléks (contona, catetan dina margins). Teu gaduh grafik vektor atanapi dukungan pikeun daptar wilanganana. Ku sabab kitu formatna teu cocok pisan pikeun buku teks, buku rujukan jeung literatur teknis (nami format malah speaks ngeunaan ieu - buku fiksi, atawa "buku fiksi").

Dina waktos anu sami, pikeun nunjukkeun inpormasi minimal ngeunaan buku - judul, panulis sareng panutup - program kedah ngolah ampir sadaya dokumén XML. Ieu kusabab metadata asalna di awal téks sareng gambar sumping di tungtung.

FB3 - ngembangkeun format

Alatan ngaronjatna sarat pikeun pormat téks buku (jeung guna mitigate sababaraha shortcomings FB2), Gribov mimiti gawé dina format FB3. Pangwangunan engké dieureunkeun, tapi dina 2014 éta dituluykeun.

Numutkeun pangarang, aranjeunna diajar kabutuhan nyata nalika medarkeun literatur téknis, melong buku teks, buku rujukan, manual tur outlined a set leuwih spésifik tina tag nu bakal ngidinan sagala buku dipintonkeun.

Dina spésifikasi anyar, format FictionBook mangrupikeun arsip pos dimana metadata, gambar sareng téks disimpen salaku file anu misah. Sarat pikeun format file pos sareng konvénsi pikeun organisasina dijelaskeun dina standar ECMA-376, nu ngahartikeun Open XML.

Sajumlah perbaikan dilakukeun patali jeung pormat (spasi, underlining) jeung objék anyar ditambahkeun - "blok" - nu pormat hiji fragmen sawenang tina buku dina bentuk quadrangle sarta bisa dipasang dina téks kalawan wraparound a. Ayeuna aya dukungan pikeun daptar nomer sareng bullet.

FB3 disebarkeun dina lisénsi gratis sareng open source, janten sadaya utilitas sayogi pikeun penerbit sareng pangguna: konverter, éditor awan, pamiarsa. ayeuna vérsi formatna, pamaca и redaktur tiasa dipendakan dina gudang GitHub proyék.

Sacara umum, FictionBook3 masih kirang nyebar tibatan lanceukna, tapi sababaraha perpustakaan éléktronik parantos nawiskeun buku dina format ieu. Sareng liter sababaraha taun ka pengker ngumumkeun niatna pikeun mindahkeun sadaya katalogna kana format énggal. Sababaraha pamiarsa parantos ngadukung sadaya pungsi FB3 anu diperyogikeun. Salaku conto, sadaya modél pamaca ONYX modéren tiasa dianggo sareng format ieu di luar kotak, contona, Darwin 3 atawa Cleopatra 3.

E-buku sareng formatna: FB2 sareng FB3 - sajarah, pro, kontra sareng prinsip operasi
/ ONYX BOOX Cleopatra 3

Distribusi FictionBook3 anu langkung lega bakal nyiptakeun ékosistem berorientasi pikeun pinuh jeung éféktif dianggo kalayan téks dina sagala alat jeung sumberdaya kawates: tampilan hideung-bodas atawa leutik, memori low, jsb Numutkeun pamekar, buku sakali diteundeun kaluar bakal jadi merenah sakumaha mungkin di lingkungan mana wae.

PS Kami nengetan sababaraha ulasan ngeunaan pamiarsa ONYX BOOX:



sumber: www.habr.com

Tambahkeun komentar