E-bøker og deres formater: FB2 og FB3 - historie, fordeler, ulemper og operasjonsprinsipper

I forrige artikkel snakket vi om funksjoner i DjVu-formatet. I dag bestemte vi oss for å fokusere på FictionBook2-formatet, bedre kjent som FB2, og dets "etterfølger" FB3.

E-bøker og deres formater: FB2 og FB3 - historie, fordeler, ulemper og operasjonsprinsipper
/flickr/ Judit Klein / CC

Utseendet til formatet

På midten av 90-tallet, entusiaster Vi startet digitalisere sovjetiske bøker. De oversatte og bevarte litteratur i en rekke formater. Et av de første bibliotekene i Runet - Biblioteket til Maxim Moshkov - brukte en formatert tekstfil (TXT).

Valget ble gjort til fordel på grunn av motstanden mot bytekorrupsjon og allsidighet - TXT åpnes på alle operativsystemer. Imidlertid, han gjorde det vanskelig behandling av lagret tekstinformasjon. For eksempel, for å flytte til den tusende linjen, måtte 999 linjer foran den behandles. Bøker også lagret i Word-dokumenter og PDF - sistnevnte var vanskelig å konvertere til andre formater, og svake datamaskiner åpnet og vises PDF-dokumenter med forsinkelser.

HTML ble også brukt til å "lagre" elektronisk litteratur. Det gjorde indeksering, konvertering til andre formater og dokumentoppretting (merking av tekst) enklere, men det introduserte sine egne mangler. En av de mest betydningsfulle var "vaghet» standard: det tillot visse friheter når du skrev tagger. Noen av dem måtte stenges, andre (f.eks. ) - det var ikke nødvendig å lukke den. Selve taggene kan ha en vilkårlig hekkerekkefølge.

Og selv om slikt arbeid med filer ikke ble oppmuntret – slike dokumenter ble ansett som feil – krevde standarden at leserne skulle prøve å vise innholdet. Det var her det oppsto vanskeligheter, siden prosessen med å "gjette" i hver applikasjon ble implementert på sin egen måte. Samtidig er leseenheter og applikasjoner tilgjengelig på markedet på den tiden forstått ett eller to spesialiserte formater. Hvis en bok var tilgjengelig i ett format, måtte den formateres på nytt for å kunne leses. Det var ment å løse alle disse manglene Skjønnlitteratur 2, eller FB2, som tok over den første "kjemmingen" av teksten og konverteringen.

Merk at formatet hadde sin første versjon - Skjønnlitteratur 1 - Den var imidlertid bare eksperimentell, varte ikke lenge, støttes foreløpig ikke og er ikke bakoverkompatibel. Derfor betyr FictionBook oftest sin "etterfølger" - FB2-formatet.

FB2 ble opprettet av en gruppe utviklere ledet av Dmitrij Gribov, som er teknisk direktør for literselskapet, og Mikhail Matsnev, skaperen av Haali Reader. Formatet er basert på XML, som regulerer arbeid med ulukkede og nestede tagger strengere enn HTML. Et XML-dokument er ledsaget av et såkalt XML Schema. Et XML-skjema er en spesiell fil som inneholder alle taggene og beskriver reglene for deres bruk (rekkefølge, nesting, obligatorisk og valgfri, etc.). I FictionBook er diagrammet i filen FictionBook2.xsd. Et eksempel på XML-skjema finner du på link (den brukes av liters e-bokhandel).

FB2 dokumentstruktur

Tekst i dokumentet lagres i spesielle tagger - elementer av avsnittstyper: , Og . Det er også et element , som ikke har noe innhold og brukes til å sette inn hull.

Alle dokumenter starter med en root-tag , som kan vises nedenfor , , Og .

stikkord inneholder stilark for å lette konvertering til andre formater. I ligge kodet ved hjelp av base64 data som kan være nødvendig for å gjengi dokumentet.

Element inneholder all nødvendig informasjon om boken: sjanger av verket, liste over forfattere (fullt navn, e-postadresse og nettside), tittel, blokk med nøkkelord, merknad. Den kan også inneholde opplysninger om endringer som er gjort i dokumentet og opplysninger om utgiveren av boken dersom den er utgitt på papir.

Slik ser en del av blokken ut i FictionBook-oppføringen for virker "A Study in Scarlet" av Arthur Conan Doyle, hentet fra Prosjekt Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Nøkkelkomponenten i et FictionBook-dokument er . Den inneholder teksten til selve boken. Det kan være flere av disse taggene i hele dokumentet – tilleggsblokker brukes til å lagre fotnoter, kommentarer og notater.

FictionBook har også flere tagger for arbeid med hyperkoblinger. De er basert på spesifikasjonen XLink, utviklet av konsortiet W3C spesielt for å lage koblinger mellom ulike ressurser i XML-dokumenter.

Fordeler med formatet

FB2-standarden inkluderer bare det minste nødvendige settet med tagger (tilstrekkelig til å "designe" fiksjon), noe som forenkler behandlingen av leserne. Dessuten, i tilfelle av direkte betjening av leseren med FB-formatet, har brukeren muligheten til å tilpasse nesten alle visningsparametere.

Den strenge strukturen til dokumentet lar deg automatisere prosessen med konvertering fra FB-format til et hvilket som helst annet. Den samme strukturen gjør det mulig å jobbe med individuelle elementer i dokumenter - sette opp filtre etter bokforfattere, tittel, sjanger osv. Av denne grunn har FB2-formatet vunnet popularitet i Runet, og blitt standardstandarden i russiske elektroniske biblioteker og biblioteker i CIS-landene.

Ulemper med formatet

Enkelheten til FB2-formatet er fordelen og ulempen på samme tid. Dette begrenser funksjonaliteten for kompleks tekstlayout (for eksempel notater i margene). Den har ikke vektorgrafikk eller støtte for nummererte lister. Av denne grunn formatet ikke særlig egnet for lærebøker, oppslagsverk og teknisk litteratur (navnet på formatet snakker til og med om dette - skjønnlitterær bok eller "fiksjonsbok").

Samtidig, for å vise minimal informasjon om boken – tittel, forfatter og omslag – må programmet behandle nesten hele XML-dokumentet. Dette er fordi metadata kommer i begynnelsen av teksten og bilder kommer på slutten.

FB3 - formatutvikling

På grunn av økte krav til formatering av boktekster (og for å dempe noen av manglene ved FB2), begynte Gribov arbeidet med FB3-formatet. Utviklingen stoppet senere opp, men i 2014 ble det det gjenopptatt.

I følge forfatterne studerte de de virkelige behovene når de publiserte teknisk litteratur, så på lærebøker, oppslagsverk, manualer og skisserte et mer spesifikt sett med tagger som ville tillate at enhver bok kunne vises.

I den nye spesifikasjonen er FictionBook-formatet et zip-arkiv der metadata, bilder og tekst lagres som separate filer. Krav til zip-filformatet og konvensjoner for organisasjonen er spesifisert i standarden ECMA-376, som definerer åpen XML.

En rekke forbedringer ble gjort relatert til formatering (mellomrom, understreking) og et nytt objekt ble lagt til - en "blokk" - som formaterer et vilkårlig fragment av en bok i form av en firkant og kan bygges inn i tekst med omslag. Det er nå støtte for nummererte og punktlister.

FB3 distribueres under en gratis lisens og er åpen kildekode, så alle verktøy er tilgjengelige for utgivere og brukere: konverterere, skyredigerere, lesere. Nåværende versjon av format, leser и редактор kan bli funnet i prosjektets GitHub-depot.

Generelt er FictionBook3 fortsatt mindre utbredt enn sin eldre bror, men flere elektroniske biblioteker tilbyr allerede bøker i dette formatet. Og liters kunngjorde for et par år siden sin intensjon om å overføre hele katalogen til et nytt format. Noen lesere støtter allerede all nødvendig FB3-funksjonalitet. For eksempel kan alle moderne ONYX-lesermodeller fungere med dette formatet ut av esken, for eksempel, Darwin 3 eller Kleopatra 3.

E-bøker og deres formater: FB2 og FB3 - historie, fordeler, ulemper og operasjonsprinsipper
/ ONYX BOX Cleopatra 3

Bredere distribusjon av FictionBook3 vil skape et økosystem orientert å fullt og effektivt arbeide med tekst på en hvilken som helst enhet med begrensede ressurser: svart-hvitt eller liten skjerm, lite minne osv. Ifølge utviklerne vil en bok når den først er lagt ut, være så praktisk som mulig i ethvert miljø.

PS Vi gjør deg oppmerksom på flere anmeldelser av ONYX BOOX-lesere:



Kilde: www.habr.com

Legg til en kommentar