E-knjige i njihovi formati: FB2 i FB3 - istorijat, prednosti, mane i principi rada

U prethodnom članku smo govorili o tome karakteristike DjVu formata. Danas smo odlučili da se fokusiramo na format FictionBook2, poznatiji kao FB2, i njegovog “nasljednika” FB3.

E-knjige i njihovi formati: FB2 i FB3 - istorijat, prednosti, mane i principi rada
/Flickr/ Judit Klein / CC

Izgled formata

Sredinom 90-ih, entuzijasti počeo digitalizovati sovjetske knjige. Prevodili su i čuvali literaturu u raznim formatima. Jedna od prvih biblioteka u Runetu - Biblioteka Maksima Moškova - koristi formatiranu tekstualnu datoteku (TXT).

Izbor je napravljen u njegovu korist zbog njegove otpornosti na korupciju bajtova i svestranosti - TXT se otvara na bilo kojem operativnom sistemu. Međutim, on otežavao obrada pohranjenih tekstualnih informacija. Na primjer, da bi se prešlo na hiljaditi red, trebalo je obraditi 999 redova koji su mu prethodili. Knjige takođe pohranjeni u Word dokumentima i PDF-u - potonji je bilo teško pretvoriti u druge formate, a slabi kompjuteri su se otvarali i prikazano PDF dokumenti sa kašnjenjem.

HTML se takođe koristio za „čuvanje“ elektronske literature. Olakšao je indeksiranje, konverziju u druge formate i kreiranje dokumenata (označavanje teksta), ali je uveo svoje nedostatke. Jedan od najznačajnijih je bio “neodređenost» standard: dozvoljavao je određene slobode prilikom pisanja oznaka. Neki od njih su morali biti zatvoreni, drugi (npr. ) - nije bilo potrebe za zatvaranjem. Same oznake mogu imati proizvoljan redoslijed ugniježđenja.

I iako se takav rad sa fajlovima nije poticao - takvi dokumenti su smatrani netačnim - standard je zahtevao od čitalaca da pokušaju da prikažu sadržaj. Tu su se pojavile poteškoće, jer je u svakoj aplikaciji proces „pogađanja“ implementiran na svoj način. Istovremeno, uređaji za čitanje i aplikacije dostupne na tržištu u to vrijeme razumeo jedan ili dva specijalizovana formata. Ako je knjiga bila dostupna u jednom formatu, morala je biti preformatirana da bi se mogla čitati. Namjera je bila da se riješe svi ovi nedostaci FictionBook2, odnosno FB2, koji je preuzeo početno “češljanje” teksta i konverziju.

Imajte na umu da je format imao svoju prvu verziju - FictionBook1 - međutim, bio je samo eksperimentalne prirode, nije dugo trajao, trenutno nije podržan i nije kompatibilan unatrag. Stoga FictionBook najčešće znači svog “nasljednika” - FB2 format.

FB2 je kreirala grupa programera na čelu sa Dmitry Gribov, koji je tehnički direktor kompanije Liters, i Mikhail Matsnev, tvorac Haali Reader-a. Format je baziran na XML-u, koji strožije reguliše rad sa nezatvorenim i ugniježđenim oznakama nego HTML. XML dokument prati takozvana XML šema. XML šema je posebna datoteka koja sadrži sve oznake i opisuje pravila za njihovu upotrebu (redosljed, ugniježđenje, obavezno i ​​opciono, itd.). U FictionBook-u, dijagram se nalazi u datoteci FictionBook2.xsd. Primjer XML sheme može se naći na link (koristi ga litarska e-knjižara).

FB2 struktura dokumenta

Tekst u dokumentu čuva u posebnim oznakama - elementi tipova pasusa: , I . Postoji i element , koji nema sadržaja i koristi se za umetanje praznina.

Svi dokumenti počinju sa root oznakom , ispod koje se može pojaviti , , I .

Tag sadrži stilove koji olakšavaju konverziju u druge formate. IN laži kodirani koristeći base64 podatke koji mogu biti potrebni za prikazivanje dokumenta.

Element sadrži sve potrebne podatke o knjizi: žanr djela, spisak autora (ime i prezime, e-mail adresa i web stranicu), naslov, blok sa ključnim riječima, napomenu. Može sadržavati i podatke o promjenama u dokumentu i podatke o izdavaču knjige ako je objavljena na papiru.

Ovako izgleda dio bloka u unosu FictionBook za djela "Studija u grimizu" Arthura Conana Doylea, preuzeto iz Projekat Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Ključna komponenta dokumenta FictionBook je . Sadrži tekst same knjige. U dokumentu može biti nekoliko ovih oznaka - dodatni blokovi se koriste za pohranjivanje fusnota, komentara i bilješki.

FictionBook takođe nudi nekoliko oznaka za rad sa hipervezama. Oni su zasnovani na specifikaciji XLink, koju je razvio konzorcij W3C posebno za kreiranje veza između različitih resursa u XML dokumentima.

Prednosti formata

Standard FB2 uključuje samo minimalni potreban skup oznaka (dovoljan za „dizajn“ fikcije), što pojednostavljuje njegovu obradu od strane čitalaca. Štaviše, u slučaju direktnog rada čitača sa FB formatom, korisnik ima mogućnost prilagođavanja gotovo svih parametara prikaza.

Stroga struktura dokumenta omogućava vam automatizaciju procesa konverzije iz FB formata u bilo koji drugi. Ista struktura omogućava rad sa pojedinačnim elementima dokumenata - postavljanje filtera po autorima knjige, naslovu, žanru itd. Iz tog razloga je format FB2 stekao popularnost u Runetu, postajući podrazumevani standard u ruskim elektronskim bibliotekama i bibliotekama. u zemljama ZND.

Nedostaci formata

Jednostavnost FB2 formata je njegova prednost i mana u isto vrijeme. Ovo ograničava funkcionalnost za složeni izgled teksta (na primjer, bilješke na marginama). Nema vektorsku grafiku niti podršku za numerisane liste. Iz tog razloga format nije baš prikladno za udžbenike, priručnu literaturu i tehničku literaturu (naziv formata čak govori o tome - beletristička knjiga, ili „beletristika“).

Istovremeno, da bi prikazao minimalne informacije o knjizi - naslov, autor i korice - program treba da obradi skoro ceo XML dokument. To je zato što metapodaci dolaze na početku teksta, a slike na kraju.

FB3 - razvoj formata

Zbog povećanih zahtjeva za formatiranjem knjižnih tekstova (i u cilju ublažavanja nekih nedostataka FB2), Gribov je započeo rad na FB3 formatu. Razvoj je kasnije stao, ali 2014. jeste nastavljeno.

Prema riječima autora, proučavali su stvarne potrebe za objavljivanjem tehničke literature, pregledali udžbenike, priručnike, priručnike i zacrtali konkretniji set oznaka koje bi omogućile prikazivanje bilo koje knjige.

U novoj specifikaciji, format FictionBook je zip arhiva u kojoj su metapodaci, slike i tekst pohranjeni kao zasebni fajlovi. Zahtjevi za format zip datoteke i konvencije za njegovu organizaciju navedeni su u standardu ECMA-376, koji definira Open XML.

Napravljena su brojna poboljšanja vezana za formatiranje (razmak, podvlačenje) i dodat je novi objekat - "blok" - koji formatira proizvoljni fragment knjige u obliku četvorougla i može se ugraditi u tekst sa premotavanjem. Sada postoji podrška za numerisane i označene liste.

FB3 se distribuira pod besplatnom licencom i otvorenog je koda, tako da su svi uslužni programi dostupni izdavačima i korisnicima: konvertori, cloud editori, čitači. Current verzija format, čitalac и urednik može se naći u GitHub repozitorijumu projekta.

Općenito, FictionBook3 je još uvijek manje rasprostranjen od svog starijeg brata, ali nekoliko elektronskih biblioteka već nudi knjige u ovom formatu. A litre su prije par godina najavile namjeru da cijeli svoj katalog prebace u novi format. Neki čitači već podržavaju sve potrebne FB3 funkcionalnosti. Na primjer, svi moderni modeli ONYX čitača mogu raditi s ovim formatom iz kutije, na primjer, Darwin 3 ili Kleopatra 3.

E-knjige i njihovi formati: FB2 i FB3 - istorijat, prednosti, mane i principi rada
/ ONYX BOOX Kleopatra 3

Šira distribucija FictionBook3 će stvoriti ekosistem orijentisan da u potpunosti i efikasno radi sa tekstom na bilo kom uređaju sa ograničenim resursima: crno-belim ili malim ekranom, malo memorije, itd. Prema rečima programera, knjiga jednom postavljena biće što je moguće zgodnija u svakom okruženju.

PS Predstavljamo vam nekoliko recenzija ONYX BOOX čitača:



izvor: www.habr.com

Dodajte komentar