E-booki i ich formaty: FB2 i FB3 – historia, zalety, wady i zasady działania

W poprzednim artykule rozmawialiśmy o cechy formatu DjVu. Dzisiaj postanowiliśmy skupić się na formacie FictionBook2, lepiej znanym jako FB2, i jego „następcy” FB3.

E-booki i ich formaty: FB2 i FB3 – historia, zalety, wady i zasady działania
/flickr/ Judyta Klein / CC

Wygląd formatu

W połowie lat 90-tych pasjonaci zaczęliśmy digitalizować książki radzieckie. Tłumaczyli i konserwowali literaturę w różnorodnych formatach. Jedna z pierwszych bibliotek w Runet - Biblioteka Maksyma Moszkowa - użył sformatowanego pliku tekstowego (TXT).

Wybór został dokonany na jego korzyść ze względu na jego odporność na uszkodzenie bajtów i wszechstronność - TXT otwiera się na każdym systemie operacyjnym. Jednak on utrudniło to przetwarzanie przechowywanych informacji tekstowych. Na przykład, aby przejść do tysięcznej linii, należało przetworzyć 999 poprzedzających ją linii. Książki także przechowywane w dokumentach Word i PDF - ten ostatni był trudny do konwersji na inne formaty, a słabe komputery otwierały się i wystawiany Dokumenty PDF z opóźnieniami.

Do „przechowywania” literatury elektronicznej wykorzystywano także język HTML. Ułatwiło indeksowanie, konwersję do innych formatów i tworzenie dokumentów (znakowanie tekstu), ale wprowadziło własne niedociągnięcia. Jednym z najbardziej znaczących było „brak precyzji» standard: pozwalał na pewną swobodę przy pisaniu tagów. Część z nich trzeba było zamknąć, inne (np. ) - nie było potrzeby zamykania. Same znaczniki mogą mieć dowolną kolejność zagnieżdżania.

I choć nie zachęcano do takiej pracy z plikami – takie dokumenty uznawano za nieprawidłowe – standard wymagał od czytelników podjęcia próby wyświetlenia treści. Tutaj pojawiły się trudności, ponieważ w każdej aplikacji proces „zgadywania” był realizowany na swój sposób. Jednocześnie urządzenia odczytujące i aplikacje dostępne na rynku w tamtym czasie zrozumiany jeden lub dwa specjalistyczne formaty. Jeśli książka była dostępna w jednym formacie, aby można ją było przeczytać, należało ją przeformatować. Miało to na celu usunięcie wszystkich tych niedociągnięć Książka Fikcyjna2, czyli FB2, który przejął wstępne „przeczesywanie” tekstu i konwersję.

Należy pamiętać, że format miał swoją pierwszą wersję - Książka Fikcyjna1 - jednakże miało ono jedynie charakter eksperymentalny, nie trwało długo, obecnie nie jest wspierane i nie jest kompatybilne wstecz. Dlatego FictionBook najczęściej oznacza swojego „następcę” – format FB2.

FB2 został stworzony przez grupę programistów pod przewodnictwem Dmitrij Gribow, który jest dyrektorem technicznym firmy Lits, i Michaił Matsnev, twórca Haali Reader. Format opiera się na formacie XML, który bardziej rygorystycznie niż HTML reguluje pracę z tagami niezamkniętymi i zagnieżdżonymi. Dokumentowi XML towarzyszy tak zwany schemat XML. Schemat XML to specjalny plik, który zawiera wszystkie znaczniki i opisuje zasady ich użycia (kolejność, zagnieżdżanie, obowiązkowe i opcjonalne itp.). W FictionBook diagram znajduje się w pliku FictionBook2.xsd. Przykładowy schemat XML można znaleźć pod adresem powiązanie (używany jest przez sklep z e-bookami litrs).

Struktura dokumentu FB2

Tekst w dokumencie trzymane w tagach specjalnych - elementy typów akapitowych: , I . Jest też element , który nie ma treści i służy do wstawiania przerw.

Wszystkie dokumenty zaczynają się od tagu głównego , poniżej które mogą się pojawić , , I .

Etykietka zawiera arkusze stylów ułatwiające konwersję do innych formatów. W kłamstwo zakodowane przy użyciu base64 dane, które mogą być potrzebne do wygenerowania dokumentu.

Element zawiera wszystkie niezbędne informacje o książce: gatunek dzieła, spis autorów (imię i nazwisko, adres e-mail i strona internetowa), tytuł, blok ze słowami kluczowymi, adnotację. Może zawierać także informację o zmianach dokonanych w dokumencie oraz informację o wydawcy książki, jeśli została ona wydana w wersji papierowej.

Tak wygląda część bloku we wpisie FictionBook dla Pracuje „Studium w szkarłacie” Arthura Conana Doyle’a, zaczerpnięte z Projekt Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Kluczowym elementem dokumentu FictionBook jest . Zawiera tekst samej książki. Takich znaczników może być kilka w całym dokumencie – dodatkowe bloki służą do przechowywania przypisów, komentarzy i notatek.

FictionBook udostępnia także kilka znaczników do pracy z hiperłączami. Opierają się na specyfikacji XLink, opracowane przez konsorcjum W3C specjalnie do tworzenia łączy między różnymi zasobami w dokumentach XML.

Zalety formatu

Standard FB2 zawiera jedynie minimalny wymagany zestaw tagów (wystarczający do „zaprojektowania” fikcji), co ułatwia jego przetwarzanie przez czytelników. Ponadto w przypadku bezpośredniej obsługi czytnika w formacie FB użytkownik ma możliwość dostosowania niemal wszystkich parametrów wyświetlania.

Ścisła struktura dokumentu pozwala zautomatyzować proces konwersji z formatu FB na dowolny inny. Ta sama struktura umożliwia pracę z poszczególnymi elementami dokumentów - konfigurowanie filtrów według autorów książek, tytułu, gatunku itp. Z tego powodu format FB2 zyskał popularność w Runecie, stając się domyślnym standardem w rosyjskich bibliotekach elektronicznych i bibliotekach w krajach WNP.

Wady formatu

Prostota formatu FB2 jest jego zaletą i wadą jednocześnie. Ogranicza to funkcjonalność w przypadku złożonego układu tekstu (na przykład notatek na marginesach). Nie ma grafiki wektorowej ani obsługi list numerowanych. Z tego powodu format niezbyt odpowiedni w przypadku podręczników, podręczników i literatury technicznej (nazwa formatu nawet o tym mówi - książka beletrystyczna lub „książka beletrystyczna”).

Jednocześnie, aby wyświetlić minimalną ilość informacji o książce – tytuł, autor i okładka – program musi przetworzyć niemal cały dokument XML. Dzieje się tak, ponieważ metadane znajdują się na początku tekstu, a obrazy na końcu.

FB3 - rozwój formatu

Ze względu na zwiększone wymagania dotyczące formatowania tekstów książek (oraz w celu złagodzenia niektórych niedociągnięć FB2) Gribov rozpoczął prace nad formatem FB3. Rozwój później ustał, ale w 2014 roku tak było wznowione.

Zdaniem autorów zbadali realne potrzeby przy wydawaniu literatury technicznej, przejrzeli podręczniki, poradniki, podręczniki i nakreślili bardziej konkretny zestaw tagów, które pozwolą na wyświetlenie dowolnej książki.

W nowej specyfikacji format FictionBook to archiwum zip, w którym metadane, obrazy i tekst są przechowywane w oddzielnych plikach. Wymagania dotyczące formatu pliku zip i konwencji jego organizacji są określone w normie ECMA-376, który definiuje Open XML.

Wprowadzono szereg usprawnień związanych z formatowaniem (odstępy, podkreślenia) oraz dodano nowy obiekt – „blok” – który formatuje dowolny fragment książki w formie czworokąta i może być osadzony w tekście z zawijaniem. Dostępna jest teraz obsługa list numerowanych i wypunktowanych.

FB3 jest rozpowszechniany na bezpłatnej licencji i ma charakter open source, dzięki czemu wydawcy i użytkownicy mają do dyspozycji wszystkie narzędzia: konwertery, edytory chmurowe, czytniki. Aktualny wersja format, czytelnik и редактор można znaleźć w repozytorium GitHub projektu.

Ogólnie rzecz biorąc, FictionBook3 jest nadal mniej rozpowszechniony niż jego starszy brat, ale kilka bibliotek elektronicznych oferuje już książki w tym formacie. Firma Lits kilka lat temu ogłosiła zamiar przeniesienia całego katalogu do nowego formatu. Niektóre czytniki obsługują już całą niezbędną funkcjonalność FB3. Przykładowo wszystkie nowoczesne modele czytników ONYX mogą od razu współpracować z tym formatem, np. Darwina 3 lub Kleopatra 3.

E-booki i ich formaty: FB2 i FB3 – historia, zalety, wady i zasady działania
/ ONYX BOOX Kleopatra 3

Szersza dystrybucja FictionBook3 stworzy ekosystem zorientowany aby w pełni i efektywnie pracować z tekstem na dowolnym urządzeniu o ograniczonych zasobach: czarno-biały lub mały wyświetlacz, mało pamięci itp. Według twórców raz ułożona książka będzie możliwie najwygodniejsza w każdym środowisku.

PS Zwracamy uwagę na kilka recenzji czytników ONYX BOOX:



Źródło: www.habr.com

Dodaj komentarz