Libros electrónicos y sus formatos: FB2 y FB3 - historia, pros, contras y principios de trabajo

En el artículo anterior hablamos de características del formato DjVu. Hoy decidimos centrarnos en el formato FictionBook2, más conocido como FB2, y su “sucesor” FB3.

Libros electrónicos y sus formatos: FB2 y FB3 - historia, pros, contras y principios de trabajo
/flickr/ judit klein / CC

La apariencia del formato.

A mediados de los 90, los entusiastas empezamos digitalizar libros soviéticos. Tradujeron y preservaron literatura en una amplia variedad de formatos. Una de las primeras bibliotecas en Runet. Biblioteca de Maxim Moshkov - utilizó un archivo de texto formateado (TXT).

La elección se hizo a su favor debido a su resistencia a la corrupción de bytes y su versatilidad: TXT se abre en cualquier sistema operativo. Sin embargo, él lo hizo difícil procesamiento de información de texto almacenada. Por ejemplo, para pasar a la línea mil, se tuvieron que procesar 999 líneas anteriores. Libros también almacenado en documentos de Word y PDF; este último era difícil de convertir a otros formatos y las computadoras débiles se abrían y desplegado Documentos PDF con retrasos.

HTML también se utilizó para “almacenar” literatura electrónica. Facilitó la indexación, la conversión a otros formatos y la creación de documentos (etiquetado de texto), pero introdujo sus propias deficiencias. Uno de los más significativos fue “vaguedad» estándar: permitía ciertas libertades a la hora de escribir etiquetas. Algunos de ellos tuvieron que cerrarse, otros (por ejemplo, ) - no fue necesario cerrarlo. Las propias etiquetas podrían tener un orden de anidación arbitrario.

Y aunque no se fomentaba ese tipo de trabajo con archivos (dichos documentos se consideraban incorrectos), el estándar exigía que los lectores intentaran mostrar el contenido. Aquí surgieron las dificultades, ya que en cada aplicación el proceso de “adivinación” se implementó a su manera. Al mismo tiempo, los dispositivos de lectura y aplicaciones disponibles en el mercado en ese momento entendido uno o dos formatos especializados. Si un libro estaba disponible en un formato, había que reformatearlo para poder leerlo. Se pretendía solucionar todas estas carencias. FicciónLibro2, o FB2, que se hizo cargo de la "combinación" inicial del texto y la conversión.

Tenga en cuenta que el formato tuvo su primera versión: FicciónLibro1 - sin embargo, fue sólo de naturaleza experimental, no duró mucho, actualmente no es compatible y no es compatible con versiones anteriores. Por lo tanto, FictionBook suele referirse a su "sucesor": el formato FB2.

FB2 fue creado por un grupo de desarrolladores liderados por Dmitry Gribov, director técnico de la empresa litros, y Mikhail Matsnev, creador del Haali Reader. El formato se basa en XML, que regula el trabajo con etiquetas anidadas y no cerradas de forma más estricta que HTML. Un documento XML va acompañado del llamado esquema XML. Un esquema XML es un archivo especial que contiene todas las etiquetas y describe las reglas para su uso (secuencia, anidamiento, obligatorio y opcional, etc.). En FictionBook, el diagrama está en el archivo FictionBook2.xsd. Puede encontrar un esquema XML de ejemplo en enlace (lo utiliza la tienda de libros electrónicos de litros).

Estructura del documento FB2

Texto en documento guardado en etiquetas especiales - elementos de tipos de párrafos: , Y . También hay un elemento , que no tiene contenido y se utiliza para insertar espacios.

Todos los documentos comienzan con una etiqueta raíz. , debajo del cual puede aparecer , , Y .

Etiqueta Contiene hojas de estilo para facilitar la conversión a otros formatos. EN mentira codificada usando base64 datos que pueden ser necesarios para representar el documento.

Elemento contiene toda la información necesaria sobre el libro: género de la obra, lista de autores (nombre completo, dirección de correo electrónico y sitio web), título, bloque con palabras clave, anotación. También puede contener información sobre los cambios realizados en el documento e información sobre el editor del libro si se publicó en papel.

Así es como se ve parte del bloque. en la entrada de FictionBook para trabaja "Un estudio en escarlata" de Arthur Conan Doyle, tomado de Proyecto Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

El componente clave de un documento de FictionBook es . Contiene el texto del libro en sí. Puede haber varias de estas etiquetas en todo el documento; se utilizan bloques adicionales para almacenar notas al pie, comentarios y notas.

FictionBook también proporciona varias etiquetas para trabajar con hipervínculos. Se basan en la especificación. XEnlace, desarrollado por el consorcio W3C específicamente para crear enlaces entre diferentes recursos en documentos XML.

Ventajas del formato

El estándar FB2 incluye solo el conjunto mínimo requerido de etiquetas (suficiente para "diseñar" ficción), lo que simplifica su procesamiento por parte de los lectores. Además, en el caso del funcionamiento directo del lector con formato FB, el usuario tiene la posibilidad de personalizar casi todos los parámetros de visualización.

La estricta estructura del documento permite automatizar el proceso de conversión del formato FB a cualquier otro. La misma estructura permite trabajar con elementos individuales de los documentos: configurar filtros por autor del libro, título, género, etc. Por esta razón, el formato FB2 ha ganado popularidad en Runet, convirtiéndose en el estándar predeterminado en las bibliotecas y bibliotecas electrónicas rusas. en los países de la CEI.

Desventajas del formato

La sencillez del formato FB2 es su ventaja y su desventaja al mismo tiempo. Esto limita la funcionalidad para diseños de texto complejos (por ejemplo, notas en los márgenes). No tiene gráficos vectoriales ni soporte para listas numeradas. Por esta razón el formato no muy adecuado para libros de texto, libros de referencia y literatura técnica (el nombre del formato incluso habla de esto: libro de ficción o “libro de ficción”).

Al mismo tiempo, para mostrar información mínima sobre el libro (título, autor y portada), el programa necesita procesar casi todo el documento XML. Esto se debe a que los metadatos aparecen al principio del texto y las imágenes al final.

FB3 - desarrollo de formato

Debido a los mayores requisitos para formatear los textos de los libros (y para mitigar algunas de las deficiencias de FB2), Gribov comenzó a trabajar en el formato FB3. El desarrollo se detuvo más tarde, pero en 2014 fue reanudado.

Según los autores, estudiaron las necesidades reales a la hora de publicar literatura técnica, examinaron libros de texto, libros de referencia, manuales y describieron un conjunto más específico de etiquetas que permitirían mostrar cualquier libro.

En la nueva especificación, el formato FictionBook es un archivo zip en el que los metadatos, imágenes y texto se almacenan como archivos separados. Los requisitos para el formato del archivo zip y las convenciones para su organización se especifican en el estándar. ECMA-376, que define Open XML.

Se realizaron una serie de mejoras relacionadas con el formato (espaciado, subrayado) y se agregó un nuevo objeto, un "bloque", que formatea un fragmento arbitrario de un libro en forma de cuadrilátero y se puede incrustar en el texto con un envolvente. Ahora hay soporte para listas numeradas y con viñetas.

FB3 se distribuye bajo una licencia gratuita y es de código abierto, por lo que todas las utilidades están disponibles para editores y usuarios: convertidores, editores en la nube, lectores. Actual versión formato, lector и редактор se puede encontrar en el repositorio GitHub del proyecto.

En general, FictionBook3 está aún menos extendido que su hermano mayor, pero varias bibliotecas electrónicas ya ofrecen libros en este formato. Y litros anunció hace un par de años su intención de trasladar todo su catálogo a un nuevo formato. Algunos lectores ya admiten todas las funciones necesarias de FB3. Por ejemplo, todos los modelos modernos de lectores ONYX pueden funcionar con este formato desde el primer momento, por ejemplo, darwin 3 o Cleopatra 3.

Libros electrónicos y sus formatos: FB2 y FB3 - historia, pros, contras y principios de trabajo
/ BOOX ÓNIX Cleopatra 3

Una distribución más amplia de FictionBook3 creará un ecosistema orientado para trabajar completa y eficazmente con texto en cualquier dispositivo con recursos limitados: pantalla en blanco y negro o pequeña, poca memoria, etc. Según los desarrolladores, un libro una vez diseñado será lo más conveniente posible en cualquier entorno.

PD: Llamamos su atención sobre varias reseñas de lectores de ONYX BOOX:



Fuente: habr.com

Añadir un comentario