E-knihy a ich formáty: FB2 a FB3 - história, klady, zápory a princípy fungovania

V predchádzajúcom článku sme hovorili o funkcie formátu DjVu. Dnes sme sa rozhodli zamerať na formát FictionBook2, známejší ako FB2, a jeho „nástupcu“ FB3.

E-knihy a ich formáty: FB2 a FB3 - história, klady, zápory a princípy fungovania
/Flickr/ Judit Kleinová / CC

Vzhľad formátu

V polovici 90. rokov nadšenci začali sme digitalizovať sovietske knihy. Prekladali a uchovávali literatúru v rôznych formátoch. Jedna z prvých knižníc v Runete - Knižnica Maxima Moshkova - použil formátovaný textový súbor (TXT).

Voľba bola urobená v jeho prospech kvôli odolnosti voči poškodeniu bajtov a všestrannosti - TXT sa otvára na akomkoľvek operačnom systéme. Avšak on to sťažilo spracovanie uložených textových informácií. Napríklad, ak chcete prejsť na tisícy riadok, bolo potrebné spracovať 999 riadkov, ktoré mu predchádzali. Knihy tiež uložené v dokumentoch programu Word a PDF - ten sa ťažko konvertoval do iných formátov a slabé počítače sa otvárali a zobrazené Dokumenty PDF s oneskorením.

HTML sa používalo aj na „ukladanie“ elektronickej literatúry. Uľahčil indexovanie, prevod do iných formátov a vytváranie dokumentov (označovanie textu), no priniesol svoje nedostatky. Jedným z najvýznamnejších bol „vágnosť» štandard: umožňoval určité slobody pri písaní značiek. Niektoré museli byť zatvorené, iné (napr. ) - nebolo potrebné ho zatvárať. Samotné značky môžu mať ľubovoľné poradie vnorenia.

A hoci takáto práca so súbormi nebola podporovaná – takéto dokumenty boli považované za nesprávne – norma vyžadovala, aby sa čitatelia pokúsili zobraziť obsah. Tu sa vyskytli ťažkosti, pretože v každej aplikácii bol proces „hádania“ implementovaný vlastným spôsobom. Zároveň čítacie zariadenia a aplikácie dostupné v tom čase na trhu pochopil jeden alebo dva špecializované formáty. Ak bola kniha dostupná v jednom formáte, musela byť preformátovaná, aby sa dala čítať. Cieľom bolo vyriešiť všetky tieto nedostatky FictionBook2, alebo FB2, ktorý prebral prvotné “učesanie” textu a konverziu.

Všimnite si, že formát mal svoju prvú verziu - FictionBook1 - mal však iba experimentálny charakter, netrval dlho, momentálne nie je podporovaný a nie je spätne kompatibilný. Preto FictionBook najčastejšie znamená svojho „nástupcu“ - formát FB2.

FB2 vytvorila skupina vývojárov pod vedením Dmitrij Gribov, ktorý je technickým riaditeľom spoločnosti litrov, a Michail Matsnev, tvorca Haali Reader. Formát je založený na XML, ktorý reguluje prácu s neuzavretými a vnorenými značkami prísnejšie ako HTML. Dokument XML je sprevádzaný takzvanou schémou XML. Schéma XML je špeciálny súbor, ktorý obsahuje všetky značky a popisuje pravidlá ich použitia (sekvencia, vnorenie, povinné a nepovinné atď.). Vo FictionBook je diagram v súbore FictionBook2.xsd. Príklad XML schémy možno nájsť na odkaz (používa ho obchod s elektronickými knihami litrov).

Štruktúra dokumentu FB2

Text v dokumente je uložený v špeciálnych značkách - prvky typov odsekov: , A . Je tam aj prvok , ktorá nemá obsah a slúži na vkladanie medzier.

Všetky dokumenty začínajú koreňovou značkou , pod ktorým sa môže objaviť , , A .

Tag obsahuje šablóny štýlov na uľahčenie prevodu do iných formátov. IN lež zakódovaný pomocou base64 údaje, ktoré môžu byť potrebné na zobrazenie dokumentu.

Element obsahuje všetky potrebné informácie o knihe: žáner diela, zoznam autorov (celé meno, emailová adresa a webová stránka), názov, blok s kľúčovými slovami, anotácia. Môže obsahovať aj informácie o zmenách vykonaných v dokumente a informácie o vydavateľovi knihy, ak bola vydaná na papieri.

Takto vyzerá časť bloku v položke FictionBook pre Tvorba "Štúdia v šarlátovej" od Arthura Conana Doyla, prevzaté z Projekt Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Kľúčovou súčasťou dokumentu FictionBook je . Obsahuje samotný text knihy. Týchto značiek môže byť v celom dokumente niekoľko – ďalšie bloky slúžia na ukladanie poznámok pod čiarou, komentárov a poznámok.

FictionBook tiež poskytuje niekoľko značiek na prácu s hypertextovými odkazmi. Vychádzajú zo špecifikácie XLink, vyvinuté konzorciom W3C špeciálne na vytváranie prepojení medzi rôznymi zdrojmi v dokumentoch XML.

Výhody formátu

Štandard FB2 obsahuje len minimálnu požadovanú sadu tagov (dostatočnú na „dizajnovú“ fikciu), čo zjednodušuje jeho spracovanie čitateľmi. Navyše v prípade priamej prevádzky čítačky s formátom FB má používateľ možnosť prispôsobiť si takmer všetky parametre zobrazenia.

Prísna štruktúra dokumentu vám umožňuje automatizovať proces konverzie z formátu FB na akýkoľvek iný. Rovnaká štruktúra umožňuje prácu s jednotlivými prvkami dokumentov – nastavenie filtrov podľa autorov knihy, názvu, žánru atď. Z tohto dôvodu si formát FB2 získal v Runete popularitu a stal sa predvoleným štandardom v ruských elektronických knižniciach a knižniciach v krajinách SNŠ.

Nevýhody formátu

Jednoduchosť formátu FB2 je jeho výhodou a nevýhodou zároveň. To obmedzuje funkčnosť pre rozloženie zložitého textu (napríklad poznámky na okrajoch). Nemá vektorovú grafiku ani podporu pre číslované zoznamy. Z tohto dôvodu formát nie veľmi vhodné pre učebnice, referenčné knihy a technickú literatúru (o tom hovorí aj názov formátu - beletria alebo „kniha beletrie“).

Zároveň, aby sa zobrazili minimálne informácie o knihe – názov, autor a obal – potrebuje program spracovať takmer celý XML dokument. Metadáta sú totiž na začiatku textu a obrázky na konci.

FB3 - vývoj formátu

Kvôli zvýšeným požiadavkám na formátovanie textov kníh (a s cieľom zmierniť niektoré nedostatky FB2) začal Gribov pracovať na formáte FB3. Vývoj sa neskôr zastavil, no v roku 2014 už bolo obnovené.

Autori si podľa svojich slov naštudovali skutočné potreby pri vydávaní technickej literatúry, pozreli si učebnice, príručky, manuály a načrtli špecifickejšiu sadu značiek, ktoré by umožnili zobraziť akúkoľvek knihu.

V novej špecifikácii je formát FictionBook archív zip, v ktorom sú metadáta, obrázky a text uložené ako samostatné súbory. Požiadavky na formát súboru zip a konvencie pre jeho organizáciu sú špecifikované v štandarde ECMA-376, ktorý definuje Open XML.

Vykonalo sa množstvo vylepšení týkajúcich sa formátovania (medzery, podčiarknutie) a pribudol nový objekt – „blok“ – ktorý naformátuje ľubovoľný fragment knihy do tvaru štvoruholníka a dá sa vložiť do textu s obalom. Teraz existuje podpora pre číslované zoznamy a zoznamy s odrážkami.

FB3 je distribuovaný pod bezplatnou licenciou a je open source, takže všetky nástroje sú dostupné vydavateľom a používateľom: konvertory, cloudové editory, čitatelia. Aktuálne verzia formát, čitateľ и editora nájdete v úložisku GitHub projektu.

Vo všeobecnosti je FictionBook3 stále menej rozšírený ako jeho starší brat, no viaceré elektronické knižnice už knihy v tomto formáte ponúkajú. A liter pred pár rokmi oznámil svoj zámer preniesť celý svoj katalóg do nového formátu. Niektoré čítačky už podporujú všetky potrebné funkcie FB3. Napríklad všetky moderné modely čítačiek ONYX dokážu pracovať s týmto formátom hneď po vybalení, napr. Darwin v roku 3 alebo Kleopatra 3.

E-knihy a ich formáty: FB2 a FB3 - história, klady, zápory a princípy fungovania
/ ONYX BOOX Kleopatra 3

Širšia distribúcia FictionBook3 vytvorí ekosystém orientovaný plne a efektívne pracovať s textom na akomkoľvek zariadení s obmedzenými zdrojmi: čiernobiely alebo malý displej, málo pamäte atď. Podľa vývojárov bude kniha po rozložení čo najpohodlnejšia v akomkoľvek prostredí.

PS Do pozornosti dávame niekoľko recenzií čítačiek ONYX BOOX:



Zdroj: hab.com

Pridať komentár