Llibres electrònics i els seus formats: FB2 i FB3: història, pros, contres i principis de treball

En l'article anterior vam parlar característiques del format DjVu. Avui hem decidit centrar-nos en el format FictionBook2, més conegut com FB2, i el seu "successor" FB3.

Llibres electrònics i els seus formats: FB2 i FB3: història, pros, contres i principis de treball
/flickr/ Judit Klein / CC

L'aparició del format

A mitjans dels 90, entusiastes va començar digitalitzar llibres soviètics. Van traduir i conservar literatura en una gran varietat de formats. Una de les primeres biblioteques de Runet - Biblioteca de Maxim Moshkov - va utilitzar un fitxer de text formatat (TXT).

L'elecció es va fer al seu favor per la seva resistència a la corrupció de bytes i la seva versatilitat: TXT s'obre a qualsevol sistema operatiu. Tanmateix, ell ho va fer difícil processament de la informació de text emmagatzemada. Per exemple, per passar a la mil·lèsima línia, s'havien de processar 999 línies anteriors. Llibres també emmagatzemat en documents de Word i PDF - aquest últim era difícil de convertir a altres formats, i els ordinadors febles es van obrir i mostrat Documents PDF amb retards.

HTML també es va utilitzar per "emmagatzemar" literatura electrònica. Va facilitar la indexació, la conversió a altres formats i la creació de documents (etiquetatge de text), però va introduir les seves pròpies mancances. Un dels més significatius va ser “vaguetat» estàndard: permetia certes llibertats a l'hora d'escriure etiquetes. Alguns d'ells s'havien de tancar, d'altres (per exemple, ) - no calia tancar-lo. Les etiquetes en si mateixes podrien tenir un ordre de nidificació arbitrari.

I tot i que no es va fomentar aquest treball amb fitxers (aquests documents es consideraven incorrectes), la norma requeria que els lectors intentessin mostrar el contingut. Aquí és on van sorgir les dificultats, ja que en cada aplicació el procés d'“endevinar” s'implementava a la seva manera. Al mateix temps, els dispositius de lectura i les aplicacions disponibles al mercat en aquell moment entès un o dos formats especialitzats. Si un llibre estava disponible en un format, s'havia de reformatar per poder llegir-lo. Es pretenia solucionar totes aquestes mancances Llibre de ficció 2, o FB2, que es va fer càrrec del "pentinat" inicial del text i la conversió.

Tingueu en compte que el format tenia la seva primera versió: Llibre de ficció 1 - tanmateix, només va ser de naturalesa experimental, va durar poc, actualment no és compatible i no és retrocompatible. Per tant, FictionBook sovint significa el seu "successor": el format FB2.

FB2 va ser creat per un grup de desenvolupadors liderat per Dmitri Gribov, que és el director tècnic de l'empresa de litres, i Mikhail Matsnev, el creador del Haali Reader. El format es basa en XML, que regula el treball amb etiquetes no tancades i imbricades de manera més estricta que HTML. Un document XML va acompanyat de l'anomenat esquema XML. Un esquema XML és un fitxer especial que conté totes les etiquetes i descriu les regles per al seu ús (seqüència, nidificació, obligatòria i opcional, etc.). A FictionBook, el diagrama es troba al fitxer FictionBook2.xsd. Es pot trobar un exemple d'esquema XML a enllaç (l'utilitza la botiga de llibres electrònics de litres).

Estructura del document FB2

Text al document emmagatzemat en etiquetes especials: elements dels tipus de paràgraf: , I . També hi ha un element , que no té contingut i serveix per inserir buits.

Tots els documents comencen amb una etiqueta root , a sota del qual pot aparèixer , , I .

Etiqueta conté fulls d'estil per facilitar la conversió a altres formats. EN lie codificat utilitzant base 64 dades que poden ser necessàries per presentar el document.

Element conté tota la informació necessària sobre el llibre: gènere de l'obra, llista d'autors (nom complet, adreça de correu electrònic i lloc web), títol, bloc amb paraules clau, anotació. També pot contenir informació sobre els canvis fets al document i informació sobre l'editor del llibre si s'ha publicat en paper.

Així és com es veu una part del bloc a l'entrada de FictionBook per funciona "A Study in Scarlet" d'Arthur Conan Doyle, extret de Projecte Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

El component clau d'un document de FictionBook és . Conté el text del llibre en si. Hi pot haver diverses d'aquestes etiquetes al llarg del document: s'utilitzen blocs addicionals per emmagatzemar notes al peu, comentaris i notes.

FictionBook també ofereix diverses etiquetes per treballar amb hiperenllaços. Es basen en l'especificació XLink, desenvolupat pel consorci W3C específicament per crear enllaços entre diferents recursos en documents XML.

Avantatges del format

L'estàndard FB2 inclou només el conjunt mínim d'etiquetes requerides (suficients per "dissenyar" ficció), cosa que simplifica el seu processament per part dels lectors. A més, en el cas del funcionament directe del lector amb el format FB, l'usuari té l'oportunitat de personalitzar gairebé tots els paràmetres de visualització.

L'estructura estricta del document permet automatitzar el procés de conversió del format FB a qualsevol altre. La mateixa estructura permet treballar amb elements individuals de documents: configurar filtres per autors de llibres, títol, gènere, etc. Per aquest motiu, el format FB2 ha guanyat popularitat a Runet, convertint-se en l'estàndard predeterminat a les biblioteques i biblioteques electròniques russes. als països de la CEI.

Inconvenients del format

La simplicitat del format FB2 és el seu avantatge i el seu inconvenient alhora. Això limita la funcionalitat del disseny de text complex (per exemple, notes als marges). No té gràfics vectorials ni suport per a llistes numerades. Per aquest motiu el format no molt adequat per a llibres de text, llibres de consulta i literatura tècnica (el nom del format fins i tot parla d'això: llibre de ficció o "llibre de ficció").

Al mateix temps, per mostrar informació mínima sobre el llibre (títol, autor i portada), el programa necessita processar gairebé tot el document XML. Això es deu al fet que les metadades apareixen al principi del text i les imatges al final.

FB3 - desenvolupament de formats

A causa de l'augment dels requisits per donar format als textos de llibres (i per mitigar algunes de les mancances de l'FB2), Gribov va començar a treballar en el format FB3. El desenvolupament es va aturar més tard, però el 2014 sí es va reprendre.

Segons els autors, van estudiar les necessitats reals a l'hora de publicar literatura tècnica, van mirar llibres de text, llibres de consulta, manuals i van perfilar un conjunt d'etiquetes més concret que permetrien mostrar qualsevol llibre.

A la nova especificació, el format FictionBook és un arxiu zip en el qual s'emmagatzemen metadades, imatges i text com a fitxers separats. Els requisits per al format del fitxer zip i les convencions per a la seva organització s'especifiquen a l'estàndard ECMA-376, que defineix Open XML.

S'han fet una sèrie de millores relacionades amb el format (espaiat, subratllat) i s'ha afegit un nou objecte -un "bloc"- que forma un fragment arbitrari d'un llibre en forma de quadrangular i es pot incrustar al text amb un envoltant. Ara hi ha suport per a llistes numerades i amb vinyetes.

FB3 es distribueix sota una llicència gratuïta i és de codi obert, de manera que totes les utilitats estan disponibles per a editors i usuaris: convertidors, editors en núvol, lectors. Actual versió format, lector и l'editor es pot trobar al repositori GitHub del projecte.

En general, FictionBook3 encara està menys estès que el seu germà gran, però diverses biblioteques electròniques ja ofereixen llibres en aquest format. I litres fa un parell d'anys van anunciar la seva intenció de traslladar tot el seu catàleg a un nou format. Alguns lectors ja admeten totes les funcionalitats necessàries de FB3. Per exemple, tots els models moderns de lectors ONYX poden funcionar amb aquest format fora de la caixa, per exemple, Darwin 3 o Cleòpatra 3.

Llibres electrònics i els seus formats: FB2 i FB3: història, pros, contres i principis de treball
/ BOIXA D'ÒNIX Cleopatra 3

Una distribució més àmplia de FictionBook3 crearà un ecosistema orientat per treballar de manera completa i eficaç amb text en qualsevol dispositiu amb recursos limitats: pantalla en blanc i negre o petita, poca memòria, etc. Segons els desenvolupadors, un llibre un cop disposat serà el més còmode possible en qualsevol entorn.

PS Us posem a la vostra atenció diverses ressenyes dels lectors ONYX BOOX:



Font: www.habr.com

Afegeix comentari