E-book e loro formati: FB2 e FB3: storia, pro, contro e principi di funzionamento

Nell'articolo precedente abbiamo parlato caratteristiche del formato DjVu. Oggi abbiamo deciso di concentrarci sul formato FictionBook2, meglio conosciuto come FB2, e sul suo “successore” FB3.

E-book e loro formati: FB2 e FB3: storia, pro, contro e principi di funzionamento
/flickr/ Judit Klein / CC

L'aspetto del formato

A metà degli anni '90, appassionati abbiamo iniziato digitalizzare i libri sovietici. Hanno tradotto e conservato la letteratura in un'ampia varietà di formati. Una delle prime biblioteche in Runet - Biblioteca di Maxim Moshkov - utilizzato un file di testo formattato (TXT).

La scelta è stata fatta a suo favore per la sua resistenza alla corruzione dei byte e alla versatilità: TXT si apre su qualsiasi sistema operativo. Tuttavia, lui lo ha reso difficile elaborazione delle informazioni di testo memorizzate. Ad esempio, per passare alla millesima riga, è stato necessario elaborare le 999 righe che la precedono. Anche libri immagazzinato nei documenti Word e PDF: quest'ultimo era difficile da convertire in altri formati e i computer deboli si aprivano e visualizzato Documenti PDF con ritardi.

L'HTML veniva utilizzato anche per “archiviare” la letteratura elettronica. Ha reso più semplice l'indicizzazione, la conversione in altri formati e la creazione di documenti (tagging del testo), ma ha introdotto i suoi limiti. Uno dei più significativi è stato “vaghezza» standard: concedeva alcune libertà nella scrittura dei tag. Alcuni di essi hanno dovuto essere chiusi, altri (ad esempio, ) - non era necessario chiuderlo. I tag stessi potrebbero avere un ordine di nidificazione arbitrario.

E sebbene tale lavoro con i file non fosse incoraggiato - tali documenti erano considerati errati - lo standard richiedeva ai lettori di provare a visualizzare il contenuto. È qui che sono sorte le difficoltà, poiché in ciascuna applicazione il processo di "indovinare" è stato implementato a modo suo. Allo stesso tempo, i dispositivi di lettura e le applicazioni disponibili sul mercato in quel momento inteso uno o due formati specializzati. Se un libro era disponibile in un formato, doveva essere riformattato per poter essere letto. Aveva lo scopo di risolvere tutte queste carenze Libro di narrativa2, oppure FB2, che si è occupato della “pettinatura” iniziale del testo e della conversione.

Tieni presente che il formato aveva la sua prima versione: Libro di narrativa1 - tuttavia, era solo di natura sperimentale, non è durato a lungo, attualmente non è supportato e non è compatibile con le versioni precedenti. Pertanto, FictionBook significa molto spesso il suo "successore": il formato FB2.

FB2 è stato creato da un gruppo di sviluppatori guidati da Dmitrij Gribov, che è il direttore tecnico dell'azienda di litri, e Mikhail Matsnev, il creatore di Haali Reader. Il formato è basato su XML, che regola il lavoro con tag non chiusi e nidificati in modo più rigoroso rispetto all'HTML. Un documento XML è accompagnato da un cosiddetto schema XML. Uno schema XML è un file speciale che contiene tutti i tag e descrive le regole per il loro utilizzo (sequenza, annidamento, obbligatorio e facoltativo, ecc.). In FictionBook, il diagramma si trova nel file FictionBook2.xsd. È possibile trovare un esempio di schema XML all'indirizzo collegamento (viene utilizzato dal negozio di e-book Litri).

Struttura del documento FB2

Testo nel documento è memorizzato in tag speciali - elementi dei tipi di paragrafo: , E . C'è anche un elemento , che non ha contenuto e viene utilizzato per inserire spazi vuoti.

Tutti i documenti iniziano con un tag radice , di seguito che può apparire , , E .

Etichetta contiene fogli di stile per facilitare la conversione in altri formati. IN bugia codificata utilizzando base64 dati che potrebbero essere necessari per riprodurre il documento.

Elemento contiene tutte le informazioni necessarie sul libro: genere dell'opera, elenco degli autori (nome completo, indirizzo email e sito web), titolo, blocco con parole chiave, annotazione. Può anche contenere informazioni sulle modifiche apportate al documento e informazioni sull'editore del libro se è stato pubblicato su carta.

Ecco come appare la parte del blocco nella voce FictionBook per lavori "Uno studio in rosso" di Arthur Conan Doyle, tratto da Progetto Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Il componente chiave di un documento FictionBook è . Contiene il testo del libro stesso. Possono essere presenti diversi tag di questo tipo in tutto il documento: vengono utilizzati blocchi aggiuntivi per memorizzare note a piè di pagina, commenti e note.

FictionBook fornisce anche diversi tag per lavorare con i collegamenti ipertestuali. Si basano sulle specifiche XLink, sviluppato dal consorzio W3C specificamente per creare collegamenti tra diverse risorse nei documenti XML.

Vantaggi del formato

Lo standard FB2 include solo il set minimo di tag richiesto (sufficiente per "progettare" la narrativa), il che ne semplifica l'elaborazione da parte dei lettori. Inoltre, nel caso di funzionamento diretto del lettore con il formato FB, l'utente ha la possibilità di personalizzare quasi tutti i parametri di visualizzazione.

La rigorosa struttura del documento consente di automatizzare il processo di conversione dal formato FB a qualsiasi altro. La stessa struttura consente di lavorare con singoli elementi di documenti: impostare filtri per autore del libro, titolo, genere, ecc. Per questo motivo, il formato FB2 ha guadagnato popolarità in Runet, diventando lo standard predefinito nelle biblioteche e biblioteche elettroniche russe. nei paesi della CSI.

Svantaggi del formato

La semplicità del formato FB2 è allo stesso tempo un vantaggio e uno svantaggio. Ciò limita la funzionalità per il layout di testo complesso (ad esempio, note ai margini). Non dispone di grafica vettoriale né supporto per elenchi numerati. Per questo motivo il formato non molto adatto per libri di testo, libri di consultazione e letteratura tecnica (il nome del formato ne parla anche: libro di narrativa o "libro di narrativa").

Allo stesso tempo, per visualizzare informazioni minime sul libro - titolo, autore e copertina - il programma deve elaborare quasi l'intero documento XML. Questo perché i metadati si trovano all'inizio del testo e le immagini alla fine.

FB3 - sviluppo del formato

A causa dei maggiori requisiti per la formattazione dei testi dei libri (e per mitigare alcune delle carenze di FB2), Gribov ha iniziato a lavorare sul formato FB3. Successivamente lo sviluppo si è interrotto, ma nel 2014 è stato così ripreso.

Secondo gli autori, hanno studiato le reali esigenze della pubblicazione di letteratura tecnica, hanno esaminato libri di testo, libri di consultazione, manuali e hanno delineato un insieme più specifico di tag che consentirebbero di visualizzare qualsiasi libro.

Nella nuova specifica, il formato FictionBook è un archivio zip in cui metadati, immagini e testo sono archiviati come file separati. I requisiti per il formato del file zip e le convenzioni per la sua organizzazione sono specificati nello standard ECMA-376, che definisce Open XML.

Sono stati apportati numerosi miglioramenti relativi alla formattazione (spaziatura, sottolineatura) ed è stato aggiunto un nuovo oggetto - un "blocco" - che formatta un frammento arbitrario di un libro sotto forma di un quadrilatero e può essere incorporato nel testo con un contorno. Ora è disponibile il supporto per elenchi numerati e puntati.

FB3 è distribuito con licenza gratuita ed è open source, quindi tutte le utilità sono disponibili per editori e utenti: convertitori, editor cloud, lettori. Attuale versione formato, lettore и редактор può essere trovato nel repository GitHub del progetto.

In generale FictionBook3 è ancora meno diffuso del fratello maggiore, ma diverse biblioteche elettroniche offrono già libri in questo formato. E litri un paio di anni fa hanno annunciato l'intenzione di trasferire l'intero catalogo in un nuovo formato. Alcuni lettori supportano già tutte le funzionalità FB3 necessarie. Ad esempio, tutti i moderni modelli di lettori ONYX possono funzionare con questo formato immediatamente, ad esempio, Darwin 3 o Cleopatra 3.

E-book e loro formati: FB2 e FB3: storia, pro, contro e principi di funzionamento
/ ONYX BOOX Cleopatra 3

Una distribuzione più ampia di FictionBook3 creerà un ecosistema orientata per lavorare in modo completo ed efficace con il testo su qualsiasi dispositivo con risorse limitate: display in bianco e nero o piccolo, memoria insufficiente, ecc. Secondo gli sviluppatori, un libro una volta impaginato sarà il più conveniente possibile in qualsiasi ambiente.

PS Portiamo alla vostra attenzione diverse recensioni di lettori ONYX BOOX:



Fonte: habr.com

Aggiungi un commento