E-knjige in njihovi formati: FB2 in FB3 - zgodovina, prednosti, slabosti in principi delovanja

V prejšnjem članku smo govorili o značilnosti zapisa DjVu. Danes smo se odločili, da se osredotočimo na format FictionBook2, bolj znan kot FB2, in njegovega "naslednika" FB3.

E-knjige in njihovi formati: FB2 in FB3 - zgodovina, prednosti, slabosti in principi delovanja
/flickr/ Judit Klein / CC

Videz formata

Sredi 90. entuziasti začeli smo digitalizirati sovjetske knjige. Prevajali in hranili so literaturo v najrazličnejših formatih. Ena prvih knjižnic v Runetu - Knjižnica Maksima Moškova - uporabili formatirano besedilno datoteko (TXT).

Izbira je bila sprejeta v njegovo korist zaradi odpornosti na poškodbe bajtov in vsestranskosti - TXT se odpre v katerem koli operacijskem sistemu. Vendar pa on otežil obdelava shranjenih besedilnih informacij. Na primer, da se premaknete na tisočo vrstico, je bilo treba obdelati 999 vrstic pred njo. Tudi knjige shranjeno v dokumentih Word in PDF - slednjega je bilo težko pretvoriti v druge formate, šibki računalniki pa so odpirali in prikazano Dokumenti PDF z zamudami.

HTML je bil uporabljen tudi za »shranjevanje« elektronske literature. Poenostavil je indeksiranje, pretvorbo v druge formate in ustvarjanje dokumentov (označevanje besedila), vendar je uvedel svoje pomanjkljivosti. Ena najpomembnejših je bila »nejasnost» standard: dovoljeval je določene svoboščine pri pisanju oznak. Nekatere so morali zapreti, druge (npr. ) - ni ga bilo treba zapreti. Oznake same imajo lahko poljuben vrstni red gnezdenja.

In čeprav se takšno delo z datotekami ni spodbujalo - taki dokumenti so veljali za nepravilne - je standard od bralcev zahteval, da poskušajo prikazati vsebino. Tu so se pojavile težave, saj je bil v vsaki aplikaciji postopek "ugibanja" izveden na svoj način. Hkrati pa bralne naprave in aplikacije, ki so takrat na voljo na trgu razumel en ali dva specializirana formata. Če je bila knjiga na voljo v enem formatu, jo je bilo treba preoblikovati, da jo je bilo mogoče brati. Namenjen je bil odpravi vseh teh pomanjkljivosti FictionBook2, oziroma FB2, ki je prevzel začetno “česanje” besedila in pretvorbo.

Upoštevajte, da je format imel svojo prvo različico - FictionBook1 - vendar je bil samo eksperimentalne narave, ni trajal dolgo, trenutno ni podprt in ni združljiv nazaj. Zato FictionBook najpogosteje pomeni njegovega "naslednika" - format FB2.

FB2 je ustvarila skupina razvijalcev pod vodstvom Dmitrij Gribov, ki je tehnični direktor podjetja Liters, in Mikhail Matsnev, ustvarjalec Haali Readerja. Format temelji na XML, ki delo z nezaprtimi in ugnezdenimi oznakami ureja strožje kot HTML. Dokument XML spremlja tako imenovana shema XML. Shema XML je posebna datoteka, ki vsebuje vse oznake in opisuje pravila njihove uporabe (zaporedje, gnezdenje, obvezno in neobvezno itd.). V FictionBooku je diagram v datoteki FictionBook2.xsd. Primer sheme XML je na voljo na povezava (uporablja ga e-knjigarna liters).

Struktura dokumenta FB2

Besedilo v dokumentu shranjeno v posebnih oznakah - elementi vrst odstavkov: , in . Obstaja tudi element , ki nima vsebine in se uporablja za vstavljanje vrzeli.

Vsi dokumenti se začnejo s korensko oznako , spodaj se lahko pojavi , , in .

Oznaka vsebuje slogovne liste za lažjo pretvorbo v druge formate. IN laž kodirana z uporabo base64 podatke, ki so morda potrebni za upodabljanje dokumenta.

Element vsebuje vse potrebne podatke o knjigi: žanr dela, seznam avtorjev (polno ime, elektronski naslov in spletna stran), naslov, blok s ključnimi besedami, opombo. Vsebuje lahko tudi podatke o spremembah dokumenta in podatke o založniku knjige, če je bila izdana na papirju.

Takole izgleda del bloka v vnosu FictionBook za dela "Študija v škrlatu" Arthurja Conana Doyla, vzeto iz Projekt Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Ključna sestavina dokumenta FictionBook je . Vsebuje samo besedilo knjige. V celotnem dokumentu je lahko več teh oznak - dodatni bloki se uporabljajo za shranjevanje opomb, komentarjev in opomb.

FictionBook ponuja tudi več oznak za delo s hiperpovezavami. Temeljijo na specifikaciji XLink, ki ga je razvil konzorcij W3C posebej za ustvarjanje povezav med različnimi viri v dokumentih XML.

Prednosti formata

Standard FB2 vključuje samo minimalni zahtevani nabor oznak (ki zadostuje za »oblikovanje« leposlovja), kar bralcem poenostavi njegovo obdelavo. Poleg tega ima uporabnik v primeru neposrednega delovanja bralnika s formatom FB možnost prilagajanja skoraj vseh parametrov prikaza.

Stroga struktura dokumenta omogoča avtomatizacijo procesa pretvorbe iz FB formata v katerega koli drugega. Ista struktura omogoča delo s posameznimi elementi dokumentov - nastavitev filtrov po avtorjih knjig, naslovu, žanru itd. Zaradi tega je format FB2 postal priljubljen v Runetu in postal privzeti standard v ruskih elektronskih knjižnicah in knjižnicah v državah CIS.

Slabosti formata

Enostavnost formata FB2 je njegova prednost in hkrati slabost. To omejuje funkcionalnost za zapleteno postavitev besedila (na primer opombe na robovih). Nima vektorske grafike ali podpore za oštevilčene sezname. Iz tega razloga format ni zelo primeren za učbenike, referenčne knjige in tehnično literaturo (o tem govori celo ime formata - leposlovna knjiga ali "leposlovna knjiga").

Hkrati mora program za prikaz minimalnih informacij o knjigi - naslov, avtor in naslovnica - obdelati skoraj celoten dokument XML. To je zato, ker so metapodatki na začetku besedila, slike pa na koncu.

FB3 - razvoj formata

Zaradi povečanih zahtev po oblikovanju knjižnih besedil (in da bi ublažil nekatere pomanjkljivosti FB2), je Gribov začel delati na formatu FB3. Razvoj se je pozneje ustavil, leta 2014 pa je nadaljevali.

Po besedah ​​avtorjev so preučili dejanske potrebe pri izdajanju strokovne literature, si ogledali učbenike, priročnike, priročnike in začrtali natančnejši nabor oznak, ki bi omogočil prikaz katere koli knjige.

V novi specifikaciji je format FictionBook zip arhiv, v katerem so metapodatki, slike in besedilo shranjeni kot ločene datoteke. Zahteve za format datoteke zip in konvencije za njeno organizacijo so določene v standardu ECMA-376, ki definira Open XML.

Izvedene so bile številne izboljšave v zvezi s formatiranjem (razmiki, podčrtaji) in dodan je bil nov objekt - "blok" - ki oblikuje poljuben del knjige v obliki štirikotnika in ga je mogoče vstaviti v besedilo z ovijem. Zdaj obstaja podpora za oštevilčene in označene sezname.

FB3 se distribuira pod brezplačno licenco in je odprtokoden, zato so založnikom in uporabnikom na voljo vsi pripomočki: pretvorniki, urejevalniki v oblaku, bralniki. Trenutno različico format, bralec и urednik najdete v repozitoriju projekta GitHub.

Na splošno je FictionBook3 še vedno manj razširjen kot njegov starejši brat, vendar več elektronskih knjižnic že ponuja knjige v tem formatu. In liters je pred nekaj leti napovedal, da namerava celoten katalog prenesti v nov format. Nekateri bralniki že podpirajo vse potrebne funkcije FB3. Na primer, vsi sodobni modeli bralnikov ONYX lahko delujejo s tem formatom takoj po namestitvi, na primer Darwin 3 ali Kleopatra 3.

E-knjige in njihovi formati: FB2 in FB3 - zgodovina, prednosti, slabosti in principi delovanja
/ ONYX BOOX Kleopatra 3

Širša distribucija FictionBook3 bo ustvarila ekosistem usmerjeno za popolno in učinkovito delo z besedilom na kateri koli napravi z omejenimi viri: črno-bel ali majhen zaslon, premalo pomnilnika itd. Po besedah ​​razvijalcev bo knjiga, ko bo postavljena, čim bolj priročna v katerem koli okolju.

PS Predstavljamo vam več ocen bralcev ONYX BOOX:



Vir: www.habr.com

Dodaj komentar