E-knjige i njihovi formati: FB2 i FB3 - povijest, prednosti, mane i principi rada

U prethodnom članku o kojem smo govorili značajke DjVu formata. Danas smo se odlučili fokusirati na format FictionBook2, poznatiji kao FB2, i njegovog “nasljednika” FB3.

E-knjige i njihovi formati: FB2 i FB3 - povijest, prednosti, mane i principi rada
/flickr/ Judit Klein / CC

Izgled formata

Sredinom 90-ih, entuzijasti počeli smo digitalizirati sovjetske knjige. Prevodili su i čuvali književnost u najrazličitijim formatima. Jedna od prvih knjižnica u Runetu - Knjižnica Maksima Moškova - koristio formatiranu tekstualnu datoteku (TXT).

Odabir je napravljen u njegovu korist zbog otpornosti na oštećenje bajtova i svestranosti - TXT se otvara na bilo kojem operativnom sustavu. Međutim, on otežavao obrada pohranjenih tekstualnih informacija. Na primjer, da biste prešli na tisućiti redak, trebalo je obraditi 999 redaka koji mu prethode. Knjige također pohranjeno u Word dokumentima i PDF-u - potonji je bilo teško pretvoriti u druge formate, a slaba računala otvarala su i prikazano PDF dokumenti s kašnjenjem.

HTML se također koristio za “skladištenje” elektroničke literature. Olakšao je indeksiranje, pretvorbu u druge formate i stvaranje dokumenata (označavanje teksta), ali je uveo svoje nedostatke. Jedan od najznačajnijih bio je “neodređenost» standard: dopuštao je određene slobode pri pisanju oznaka. Neki su morali biti zatvoreni, drugi (npr. ) - nije bilo potrebe za zatvaranjem. Same oznake mogu imati proizvoljan redoslijed ugniježđivanja.

I premda se takav rad s datotekama nije poticao - takvi su dokumenti smatrani netočnima - standard je zahtijevao od čitatelja da pokušaju prikazati sadržaj. Tu su se pojavile poteškoće, jer je u svakoj aplikaciji proces "pogađanja" implementiran na svoj način. Istodobno, uređaji za čitanje i aplikacije dostupne na tržištu u to vrijeme razumjeli jedan ili dva specijalizirana formata. Ako je knjiga bila dostupna u jednom formatu, morala se preoblikovati da bi se mogla čitati. Namjera je bila riješiti sve te nedostatke FictionBook2, odnosno FB2 koji je preuzeo početno “češljanje” teksta i konverziju.

Imajte na umu da je format imao svoju prvu verziju - FictionBook1 - međutim, bio je samo eksperimentalne prirode, nije dugo trajao, trenutno nije podržan i nije kompatibilan sa starijim verzijama. Stoga se pod FictionBook najčešće misli na njegovog "nasljednika" - FB2 format.

FB2 je kreirala grupa programera na čelu s Dmitrij Gribov, koji je tehnički direktor tvrtke Liters, i Mikhail Matsnev, tvorac Haali Readera. Format se temelji na XML-u, koji regulira rad s nezatvorenim i ugniježđenim oznakama strože nego HTML. XML dokument prati takozvana XML shema. XML shema je posebna datoteka koja sadrži sve oznake i opisuje pravila njihove upotrebe (redoslijed, ugniježđivanje, obavezno i ​​izborno itd.). U FictionBooku, dijagram se nalazi u datoteci FictionBook2.xsd. Primjer XML sheme može se pronaći na link (koristi ga Liters e-book store).

FB2 struktura dokumenta

Tekst u dokumentu je pohranjena u posebnim oznakama - elementi vrsta odlomaka: , I . Postoji i element , koji nema sadržaj i služi za umetanje praznina.

Svi dokumenti započinju korijenskom oznakom , ispod koje se može pojaviti , , I .

Označiti sadrži tablice stilova za olakšavanje pretvorbe u druge formate. U laž kodirana pomoću base64 podatke koji mogu biti potrebni za iscrtavanje dokumenta.

Element sadrži sve potrebne podatke o knjizi: žanr djela, popis autora (ime i prezime, e-mail adresa i web stranica), naslov, blok s ključnim riječima, napomenu. Može sadržavati i podatke o izmjenama dokumenta te podatke o izdavaču knjige ako je objavljena na papiru.

Ovako izgleda dio bloka u unosu FictionBook za djela "Studija u grimizu" Arthura Conana Doylea, preuzeto iz Projekt Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Ključna komponenta dokumenta FictionBook je . Sadrži sam tekst knjige. U cijelom dokumentu može biti nekoliko ovih oznaka - dodatni blokovi koriste se za pohranjivanje fusnota, komentara i bilješki.

FictionBook također nudi nekoliko oznaka za rad s hipervezama. Temelje se na specifikaciji XLink, koji je razvio konzorcij W3C posebno za stvaranje veza između različitih izvora u XML dokumentima.

Prednosti formata

Standard FB2 uključuje samo minimalni potrebni skup oznaka (dovoljan za “dizajn” fikcije), što čitateljima pojednostavljuje njegovu obradu. Štoviše, u slučaju izravnog rada čitača s FB formatom, korisnik ima mogućnost prilagoditi gotovo sve parametre prikaza.

Stroga struktura dokumenta omogućuje vam automatizaciju procesa konverzije iz FB formata u bilo koji drugi. Ista struktura omogućuje rad s pojedinačnim elementima dokumenata - postavljanje filtara prema autorima knjiga, naslovu, žanru itd. Iz tog je razloga format FB2 stekao popularnost u Runetu, postavši zadani standard u ruskim elektroničkim knjižnicama i knjižnicama u zemljama ZND-a.

Nedostaci formata

Jednostavnost FB2 formata njegova je prednost i mana u isto vrijeme. Ovo ograničava funkcionalnost za složeni raspored teksta (na primjer, bilješke na marginama). Nema vektorsku grafiku niti podršku za numerirane popise. Iz tog razloga format nije baš prikladno za udžbenike, priručnike i tehničku literaturu (o tome govori i naziv formata - fiction book, ili “fiction book”).

Istovremeno, da bi prikazao minimalne podatke o knjizi - naslov, autora i naslovnicu - program treba obraditi gotovo cijeli XML dokument. To je zato što metapodaci dolaze na početku teksta, a slike na kraju.

FB3 - razvoj formata

Zbog povećanih zahtjeva za formatiranjem tekstova knjiga (i kako bi se ublažili neki nedostaci FB2), Gribov je započeo rad na formatu FB3. Kasnije je razvoj stao, ali 2014. je nastavljeno.

Prema riječima autora, proučili su stvarne potrebe pri izdavanju tehničke literature, pogledali udžbenike, priručnike, priručnike i zacrtali specifičniji skup oznaka koji bi omogućio prikazivanje bilo koje knjige.

U novoj specifikaciji, format FictionBook je zip arhiva u kojoj su metapodaci, slike i tekst pohranjeni kao zasebne datoteke. Zahtjevi za format zip datoteke i konvencije za njezinu organizaciju navedeni su u standardu ECMA-376, koji definira Open XML.

Učinjena su brojna poboljšanja vezana uz formatiranje (razmaci, podcrtavanje) i dodan je novi objekt - "blok" - koji oblikuje proizvoljni fragment knjige u obliku četverokuta i može se ugraditi u tekst omotom. Sada postoji podrška za numerirane popise i popise s grafičkim oznakama.

FB3 se distribuira pod besplatnom licencom i otvorenog je koda, tako da su izdavačima i korisnicima dostupni svi uslužni programi: pretvarači, uređivači u oblaku, čitači. Trenutno verzija format, čitač и urednik mogu se pronaći u GitHub repozitoriju projekta.

Općenito, FictionBook3 je još uvijek manje raširen od svog starijeg brata, ali nekoliko elektroničkih knjižnica već nudi knjige u ovom formatu. I Liters je prije par godina najavio namjeru da cijeli svoj katalog prebaci u novi format. Neki čitači već podržavaju sve potrebne FB3 funkcionalnosti. Na primjer, svi moderni modeli ONYX čitača mogu raditi s ovim formatom izvan kutije, na primjer, Darwin 3 ili Kleopatra 3.

E-knjige i njihovi formati: FB2 i FB3 - povijest, prednosti, mane i principi rada
/ ONYX BOOX Kleopatra 3

Šira distribucija FictionBook3 stvorit će ekosustav orijentiran za potpuni i učinkovit rad s tekstom na bilo kojem uređaju s ograničenim resursima: crno-bijeli ili mali zaslon, malo memorije, itd. Prema programerima, jednom postavljena knjiga bit će što praktičnija u bilo kojem okruženju.

PS Predstavljamo vam nekoliko recenzija ONYX BOOX čitača:



Izvor: www.habr.com

Dodajte komentar