Електронни книги и техните формати: FB2 и FB3 - история, плюсове, минуси и принципи на работа

В предишната статия говорихме за функции на формата DjVu. Днес решихме да се съсредоточим върху формата FictionBook2, по-известен като FB2, и неговия „наследник“ FB3.

Електронни книги и техните формати: FB2 и FB3 - история, плюсове, минуси и принципи на работа
/flickr/ Юдит Клайн / CC

Появата на формата

В средата на 90-те ентусиастите започнахме дигитализират съветските книги. Те превеждат и съхраняват литература в голямо разнообразие от формати. Една от първите библиотеки в Runet - Библиотека на Максим Мошков - използва форматиран текстов файл (TXT).

Изборът беше направен в негова полза поради неговата устойчивост на повреждане на байтове и гъвкавост - TXT се отваря на всяка операционна система. Въпреки това той затрудни обработка на съхранена текстова информация. Например, за да преминете към хилядния ред, трябва да бъдат обработени 999 реда преди него. Книги също съхранени в документи на Word и PDF - последният беше труден за конвертиране в други формати, а слабите компютри отваряха и Показва PDF документи със закъснения.

HTML се използва и за „съхранение“ на електронна литература. Той улесни индексирането, преобразуването в други формати и създаването на документи (маркиране на текст), но въведе свои собствени недостатъци. Един от най-значимите беше „неопределеност» стандартен: позволява определени свободи при писане на тагове. Някои от тях трябваше да бъдат затворени, други (напр. ) - нямаше нужда да го затварям. Самите етикети могат да имат произволен ред на влагане.

И въпреки че подобна работа с файлове не се насърчаваше - подобни документи се смятаха за неправилни - стандартът изискваше читателите да се опитат да покажат съдържанието. Тук възникнаха трудности, тъй като във всяко приложение процесът на „отгатване“ беше реализиран по свой начин. В същото време четящите устройства и приложения, налични на пазара по това време разбрах един или два специализирани формата. Ако една книга беше налична в един формат, тя трябваше да бъде преформатирана, за да бъде прочетена. Имаше за цел да разреши всички тези недостатъци Художествена книга2, или FB2, който пое първоначалното „сресване“ на текста и конвертирането.

Имайте предвид, че форматът имаше първата си версия - Художествена книга1 - обаче той беше само експериментален по природа, не продължи дълго, в момента не се поддържа и не е обратно съвместим. Следователно FictionBook най-често означава неговия „наследник“ - формат FB2.

FB2 е създаден от група разработчици, ръководени от Дмитрий Грибов, който е технически директор на компанията liters, и Михаил Мацнев, създателят на Haali Reader. Форматът е базиран на XML, който регулира работата с незатворени и вложени тагове по-стриктно от HTML. XML документ е придружен от така наречената XML схема. XML схемата е специален файл, който съдържа всички тагове и описва правилата за тяхното използване (последователност, влагане, задължителни и незадължителни и т.н.). Във FictionBook диаграмата е във файла FictionBook2.xsd. Примерна XML схема може да бъде намерена на връзка (използва се от магазина за електронни книги liters).

FB2 структура на документа

Текст в документа се съхранява в специални тагове - елементи от типове параграфи: , И . Има и елемент , който няма съдържание и се използва за вмъкване на пропуски.

Всички документи започват с root таг , под който може да се появи , , И .

Етикет съдържа таблици със стилове за улесняване на конвертирането в други формати. IN лъжа, кодирана с помощта на base64 данни, които може да са необходими за рендиране на документа.

елемент съдържа цялата необходима информация за книгата: жанр на произведението, списък на авторите (пълно име, имейл адрес и уебсайт), заглавие, блок с ключови думи, анотация. Може също така да съдържа информация за направени промени в документа и информация за издателя на книгата, ако е публикувана на хартия.

Ето как изглежда част от блока в записа на FictionBook за върши работа „Етюд в алено“ от Артър Конан Дойл, взет от Проект Гутенберг:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Ключовият компонент на документа на FictionBook е . Съдържа текста на самата книга. Може да има няколко от тези етикети в целия документ - допълнителни блокове се използват за съхраняване на бележки под линия, коментари и бележки.

FictionBook предоставя и няколко тагове за работа с хипервръзки. Те се базират на спецификацията XLink, разработен от консорциума W3C специално за създаване на връзки между различни ресурси в XML документи.

Предимства на формата

Стандартът FB2 включва само минимално необходимия набор от тагове (достатъчни за „дизайн“ на фикция), което опростява обработката му от читателите. Освен това, в случай на директна работа на четеца с FB формат, потребителят има възможност да персонализира почти всички параметри на дисплея.

Строгата структура на документа ви позволява да автоматизирате процеса на конвертиране от FB формат във всеки друг. Същата структура позволява да се работи с отделни елементи на документи - настройка на филтри по автори на книги, заглавие, жанр и т.н. Поради тази причина форматът FB2 придоби популярност в Runet, превръщайки се в стандарт по подразбиране в руските електронни библиотеки и библиотеки в страните от ОНД.

Недостатъци на формата

Простотата на формата FB2 е негово предимство и недостатък едновременно. Това ограничава функционалността за сложно текстово оформление (например бележки в полетата). Няма векторна графика или поддръжка за номерирани списъци. Поради тази причина форматът не е много подходящ за учебници, справочници и техническа литература (името на формата дори говори за това - художествена книга или „художествена книга“).

В същото време, за да изведе минимална информация за книгата - заглавие, автор и корица - програмата трябва да обработи почти целия XML документ. Това е така, защото метаданните идват в началото на текста, а изображенията идват в края.

FB3 - разработка на формат

Поради повишените изисквания за форматиране на текстове на книги (и за да смекчи някои от недостатъците на FB2), Грибов започва работа върху формата FB3. Развитието по-късно спря, но през 2014 г. беше възобновено.

Според авторите те са проучили реалните нужди при издаване на техническа литература, разгледали са учебници, справочници, ръководства и са очертали по-специфичен набор от тагове, които биха позволили показването на всяка книга.

В новата спецификация форматът FictionBook е zip архив, в който метаданни, изображения и текст се съхраняват като отделни файлове. Изискванията за формата на zip файла и конвенциите за неговата организация са посочени в стандарта ECMA-376, който дефинира Open XML.

Бяха направени редица подобрения, свързани с форматирането (интервал, подчертаване) и беше добавен нов обект - „блок“ - който форматира произволен фрагмент от книга под формата на четириъгълник и може да бъде вграден в текст с обвивка. Вече има поддръжка за номерирани списъци и списъци с водещи символи.

FB3 се разпространява под безплатен лиценз и е с отворен код, така че всички помощни програми са достъпни за издатели и потребители: конвертори, облачни редактори, четци. Текущ версия формат, читател и редактор може да се намери в хранилището на GitHub на проекта.

Като цяло FictionBook3 все още е по-малко разпространен от по-големия си брат, но няколко електронни библиотеки вече предлагат книги в този формат. И литрите преди няколко години обявиха намерението си да прехвърлят целия си каталог в нов формат. Някои четци вече поддържат цялата необходима функционалност на FB3. Например, всички съвременни модели четци на ONYX могат да работят с този формат от кутията, напр. Дарвин 3 или Клеопатра 3.

Електронни книги и техните формати: FB2 и FB3 - история, плюсове, минуси и принципи на работа
/ ONYX BOOX Клеопатра 3

По-широкото разпространение на FictionBook3 ще създаде екосистема ориентиран за пълна и ефективна работа с текст на всяко устройство с ограничени ресурси: черно-бял или малък дисплей, ниска памет и т.н. Според разработчиците, една книга, веднъж изложена, ще бъде възможно най-удобна във всякаква среда.

PS Предлагаме на вашето внимание няколко ревюта на четци ONYX BOOX:



Източник: www.habr.com

Добавяне на нов коментар