E-böcker och deras format: FB2 och FB3 - historia, fördelar, nackdelar och funktionsprinciper

I föregående artikel pratade vi om funktioner i DjVu-formatet. Idag bestämde vi oss för att fokusera på FictionBook2-formatet, mer känt som FB2, och dess "efterträdare" FB3.

E-böcker och deras format: FB2 och FB3 - historia, fördelar, nackdelar och funktionsprinciper
/flickr/ Judit Klein / CC

Formatets utseende

I mitten av 90-talet, entusiaster vi började digitalisera sovjetiska böcker. De översatte och bevarade litteratur i en mängd olika format. Ett av de första biblioteken i Runet - Maxim Moshkovs bibliotek - använde en formaterad textfil (TXT).

Valet gjordes till dess fördel på grund av dess motstånd mot bytekorruption och mångsidighet - TXT öppnas på alla operativsystem. Men han gjorde det svårt bearbetning av lagrad textinformation. Till exempel, för att flytta till den tusende raden, måste 999 rader före den bearbetas. Böcker också lagrad i Word-dokument och PDF - det senare var svårt att konvertera till andra format, och svaga datorer öppnade och visas PDF-dokument med förseningar.

HTML användes också för att "lagra" elektronisk litteratur. Det gjorde indexering, konvertering till andra format och skapande av dokument (taggning av text) lättare, men det introducerade sina egna brister. En av de mest betydelsefulla var "vaghet» standard: det tillät vissa friheter när man skrev taggar. Vissa av dem måste stängas, andra (t.ex. ) - det behövdes inte stängas. Taggarna i sig kan ha en godtycklig kapsordning.

Och även om sådant arbete med filer inte uppmuntrades - sådana dokument ansågs felaktiga - krävde standarden att läsarna försökte visa innehållet. Det var här svårigheter uppstod, eftersom processen att "gissa" i varje applikation implementerades på sitt eget sätt. Samtidigt, de läsenheter och applikationer som finns på marknaden vid den tiden förstått ett eller två specialiserade format. Om en bok fanns tillgänglig i ett format måste den formateras om för att kunna läsas. Det var tänkt att lösa alla dessa brister Skönlitteraturbok 2, eller FB2, som tog över den initiala "kammaningen" av texten och konverteringen.

Observera att formatet hade sin första version - Skönlitteraturbok 1 - Det var dock bara experimentellt, varade inte länge, stöds för närvarande inte och är inte bakåtkompatibelt. Därför betyder FictionBook oftast sin "efterträdare" - FB2-formatet.

FB2 skapades av en grupp utvecklare ledda av Dmitrij Gribov, som är teknisk chef för literföretaget, och Mikhail Matsnev, skaparen av Haali Reader. Formatet är baserat på XML, som reglerar arbete med ostängda och kapslade taggar mer strikt än HTML. Ett XML-dokument åtföljs av ett så kallat XML-schema. Ett XML-schema är en speciell fil som innehåller alla taggar och beskriver reglerna för deras användning (sekvens, kapsling, obligatorisk och valfri, etc.). I FictionBook finns diagrammet i filen FictionBook2.xsd. Ett exempel på XML-schema finns på länk (den används av liters e-bokhandel).

FB2 dokumentstruktur

Text i dokument lagras i specialtaggar - element av stycketyper: , Och . Det finns också ett element , som inte har något innehåll och används för att infoga luckor.

Alla dokument börjar med en root-tagg , nedan som kan visas , , Och .

Märka innehåller stilmallar för att underlätta konvertering till andra format. I ligga kodad med hjälp av base64 data som kan behövas för att göra dokumentet.

Element innehåller all nödvändig information om boken: verkets genre, lista över författare (fullständigt namn, e-postadress och webbplats), titel, block med nyckelord, anteckning. Den kan också innehålla information om ändringar som gjorts i dokumentet och information om bokens utgivare om den publicerats på papper.

Så här ser en del av blocket ut i FictionBook-posten för Arbetar "A Study in Scarlet" av Arthur Conan Doyle, hämtad från Projekt Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Nyckelkomponenten i ett FictionBook-dokument är . Den innehåller själva bokens text. Det kan finnas flera av dessa taggar i hela dokumentet - ytterligare block används för att lagra fotnoter, kommentarer och anteckningar.

FictionBook tillhandahåller också flera taggar för att arbeta med hyperlänkar. De är baserade på specifikationen XLink, utvecklad av konsortiet W3C specifikt för att skapa länkar mellan olika resurser i XML-dokument.

Fördelar med formatet

FB2-standarden inkluderar endast den minsta nödvändiga uppsättningen taggar (tillräcklig för att "designa" fiktion), vilket förenklar behandlingen av läsarna. Dessutom, vid direkt drift av läsaren med FB-formatet, har användaren möjlighet att anpassa nästan alla visningsparametrar.

Dokumentets strikta struktur låter dig automatisera processen för konvertering från FB-format till vilket annat format som helst. Samma struktur gör det möjligt att arbeta med enskilda delar av dokument - ställ in filter efter bokförfattare, titel, genre, etc. Av denna anledning har FB2-formatet vunnit popularitet i Runet, och blivit standardstandarden i ryska elektroniska bibliotek och bibliotek i OSS-länderna.

Nackdelar med formatet

Enkelheten med FB2-formatet är dess fördel och nackdel på samma gång. Detta begränsar funktionaliteten för komplex textlayout (till exempel anteckningar i marginalerna). Den har inte vektorgrafik eller stöd för numrerade listor. Av denna anledning formatet inte särskilt lämplig för läroböcker, uppslagsböcker och teknisk litteratur (namnet på formatet talar till och med om detta - skönlitterär bok eller "fiktionsbok").

Samtidigt, för att visa minimal information om boken – titel, författare och omslag – behöver programmet bearbeta nästan hela XML-dokumentet. Det beror på att metadata kommer i början av texten och bilder kommer i slutet.

FB3 - formatutveckling

På grund av ökade krav på formatering av boktexter (och för att mildra några av bristerna i FB2) började Gribov arbetet med FB3-formatet. Utvecklingen stannade senare av, men 2014 blev det så återupptas.

Enligt författarna studerade de de verkliga behoven vid publicering av teknisk litteratur, tittade på läroböcker, referensböcker, manualer och skisserade en mer specifik uppsättning taggar som skulle göra det möjligt för alla böcker att visas.

I den nya specifikationen är FictionBook-formatet ett zip-arkiv där metadata, bilder och text lagras som separata filer. Krav på zip-filformat och konventioner för dess organisation anges i standarden ECMA-376, som definierar Open XML.

Ett antal förbättringar gjordes relaterade till formatering (mellanrum, understrykning) och ett nytt objekt lades till - ett "block" - som formaterar ett godtyckligt fragment av en bok i form av en fyrkant och kan bäddas in i text med en omslutning. Det finns nu stöd för numrerade och punktlistor.

FB3 distribueras under en gratis licens och är öppen källkod, så alla verktyg är tillgängliga för utgivare och användare: omvandlare, molnredigerare, läsare. Nuvarande version formatera, läsare и редактор kan hittas i projektets GitHub-förråd.

I allmänhet är FictionBook3 fortfarande mindre utbredd än sin äldre bror, men flera elektroniska bibliotek erbjuder redan böcker i detta format. Och liters meddelade för ett par år sedan sin avsikt att överföra hela sin katalog till ett nytt format. Vissa läsare stöder redan alla nödvändiga FB3-funktioner. Till exempel kan alla moderna modeller av ONYX-läsare arbeta med detta format direkt, till exempel, Darwin 3 eller Cleopatra 3.

E-böcker och deras format: FB2 och FB3 - historia, fördelar, nackdelar och funktionsprinciper
/ ONYX BOOX Cleopatra 3

Bredare distribution av FictionBook3 kommer att skapa ett ekosystem orienterad att fullt ut och effektivt arbeta med text på vilken enhet som helst med begränsade resurser: svartvit eller liten skärm, lågt minne, etc. Enligt utvecklarna kommer en bok när den väl har lagts ut att vara så bekväm som möjligt i alla miljöer.

PS Vi uppmärksammar flera recensioner av ONYX BOOX-läsare:



Källa: will.com

Lägg en kommentar