Książki elektroniczne i ich formaty: mowa o EPUB-ie – jego historii, zaletach i wadach

Wcześniej na blogu pisaliśmy o tym, jak pojawiły się formaty e-booków Djvu и FB2.

Tematem dzisiejszego artykułu jest EPUB.

Książki elektroniczne i ich formaty: mowa o EPUB-ie – jego historii, zaletach i wadach
Obrazek: Nathana Oakleya / CC BY

Historia formatu

W latach 90-tych na rynku e-booków dominowały autorskie rozwiązania. Wielu producentów czytników e-booków miało swój własny format. Na przykład NuvoMedia używała plików z rozszerzeniem .rb. Były to kontenery z plikiem HTML oraz plikiem .info zawierającym metadane. Taki stan rzeczy komplikował pracę wydawców – musieli oni składać książki dla każdego formatu osobno. Grupa inżynierów z Microsoftu, wspomnianej już NuvoMedia i SoftBook Press, podjęła się naprawienia sytuacji.

W tym czasie Microsoft zamierzał podbić rynek e-booków i rozwijał aplikację do czytnika e-booków dla systemu Windows 95. Można powiedzieć, że stworzenie nowego formatu było częścią strategii biznesowej giganta IT.

Jeśli mówimy o NuvoMedia, to właśnie tę firmę uważa się za producenta pierwszego masowego czytnika elektronicznego Rakieta eBook. Pamięć wewnętrzna urządzenia miała tylko osiem megabajtów, a żywotność baterii nie przekraczała 40 godzin. Jeśli chodzi o SoftBook Press, opracowali także czytniki elektroniczne. Ale ich urządzenia miały charakterystyczną cechę – wbudowany modem – pozwalały na pobieranie literatury cyfrowej bezpośrednio z SoftBookstore.

Na początku XXI wieku obie firmy – NuvoMedia i SoftBook – zostały zakupione przez firmę medialną Gemstar i połączone w Grupę Gemstar eBook. Organizacja ta przez kilka lat nadal sprzedawała czytelników (np. RCA REB 1100) i książki cyfrowe, jednak w 2003 r wycofać się z biznesu.

Wróćmy jednak do opracowania jednego standardu. W 1999 roku Microsoft, NuvoMedia i SoftBook Press założyły Open eBook Forum, które rozpoczęło prace nad projektem dokumentu, który zapoczątkował EPUB. Oryginalnie standardowe zwany OEBPS (skrót od Open EBook Publication Structure). Umożliwiło to dystrybucję publikacji cyfrowej w jednym pliku (archiwum ZIP) oraz ułatwiło przenoszenie książek pomiędzy różnymi platformami sprzętowymi.

Później firmy informatyczne Adobe, IBM, HP, Nokia, Xerox oraz wydawcy McGraw Hill i Time Warner dołączyli do Open eBook Forum. Wspólnie kontynuowali rozwój OEBPS i rozwijali ekosystem literatury cyfrowej jako całość. W 2005 roku nazwa organizacji została zmieniona na Międzynarodowe Forum Publikacji Cyfrowych, czyli IDPF.

W 2007 roku IDPF zmienił nazwę formatu OEBPS na EPUB i rozpoczął prace nad jego drugą wersją. Został zaprezentowany szerszej publiczności w 2010 roku. Nowy produkt prawie nie różnił się jednak od swojego poprzednika otrzymał wsparcie grafikę wektorową i wbudowane czcionki.

W tym czasie EPUB przejął rynek i stał się domyślnym standardem dla wielu wydawców i producentów gadżetów elektronicznych. Format był już używany przez O'Reilly i Cisco Press, a ponadto był obsługiwany przez urządzenia Apple, Sony, Barnes & Noble i ONYX BOOX.

W 2009 roku projekt Google Books ogłosił o wsparciu dla EPUB - wykorzystano go do dystrybucji ponad miliona bezpłatnych książek. Format zaczął zyskiwać popularność wśród pisarzy. W 2011 roku J.K. Rowling powiedział o planach uruchomić witrynę Pottermore i uczynić ją jedynym punktem sprzedaży książek o Potterze w formie cyfrowej.

EPUB został wybrany jako standard dystrybucji literatury, przede wszystkim ze względu na możliwość wdrożenia zabezpieczenia przed kopiowaniem (DRM). Wszystkie książki dostępne dotychczas w sklepie internetowym pisarza dostępne tylko w tym formacie.

Trzecia wersja formatu EPUB została wydana w 2011 roku. Twórcy dodali możliwość pracy z plikami audio i wideo oraz przypisami. Dziś standard nadal ewoluuje – w 2017 roku IDPF nawet wszedł część konsorcjum W3C, które wdraża standardy technologiczne dla sieci WWW.

Jak działa EPUB

Książka w formacie EPUB jest archiwum ZIP. Przechowuje tekst publikacji w postaci stron XHTML, HTML lub plików PDF. Archiwum zawiera także treści multimedialne (audio, wideo lub obrazy), czcionki i metadane. Może także zawierać dodatkowe pliki ze stylami CSS lub PLS-dokumenty zawierające informacje dla usług generowania mowy.

Za wyświetlanie treści odpowiada znacznik XML. Fragment książki z osadzonym dźwiękiem i obrazem może wyglądać tak:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html>
<html  
    
    epub_prefix="media: http://idpf.org/epub/vocab/media/#">
    <head>
        <meta charset="utf-8" />
        <link rel="stylesheet" type="text/css" href="../css/shared-culture.css" />
    </head>
    <body>
        <section class="base">
            <h1>the entire transcript</h1>
            <audio id="bgsound" epub_type="media:soundtrack media:background"
                src="../audio/asharedculture_soundtrack.mp3" autoplay="" loop="">
                <div class="errmsg">
                    <p>Your Reading System does not support (this) audio</p>
                </div>
            </audio>

            <p>What does it mean to be human if we don't have a shared culture? What
 does a shared culture mean if we can't share it? It's only in the last
 100, or 150 years or so, that we started tightly restricting how that
 culture gets used.</p>

            <img class="left" src="../images/326261902_3fa36f548d.jpg"
                alt="child against a wall" />
        </section>
    </body>
</html>

Oprócz plików treści archiwum zawiera specjalny dokument nawigacyjny (Dokument Nawigacyjny). Opisuje układ tekstu i obrazów w książce. Aplikacje czytnika uzyskują do niego dostęp, jeśli czytelnik chce „przeskoczyć” kilka stron.

Kolejnym wymaganym plikiem w archiwum jest package. Zawiera metadane – informacje o autorze, wydawcy, języku, tytule i tak dalej. Zawiera także spis (grzbiet) podrozdziałów książki. Można wyświetlić przykładowy dokument pakietu w repozytorium IDPF na GitHubie.

godność

Zaletą formatu jest jego elastyczność. EPUB umożliwia tworzenie dynamicznego układu dokumentu, który dopasowuje się do rozmiaru ekranu urządzenia. Jest to jeden z głównych powodów, dla których format ten jest obsługiwany przez dużą liczbę czytników (i innych urządzeń elektronicznych). Przykładowo wszystkie czytniki ONYX BOOX współpracują z EPUB-em od razu po wyjęciu z pudełka: od podstawowego i 6-calowego Cezar 3 aż do wersji premium i 9,7-calowej Euclid.

Książki elektroniczne i ich formaty: mowa o EPUB-ie – jego historii, zaletach i wadach
/ ONYKS BOOK Cezar 3

Ponieważ format jest oparty na popularnych standardach (XML), można go łatwo przekonwertować do czytania w Internecie. EPUB obsługuje także elementy interaktywne. Tak, podobne elementy istnieją w formacie PDF, ale można je dodać do dokumentu PDF tylko za pomocą zastrzeżonego oprogramowania. W przypadku EPUB są one dodawane do książki za pomocą znaczników i znaczników XML w dowolnym edytorze tekstu.

Kolejną zaletą EPUB są jego funkcje dla osób z problemami ze wzrokiem lub dysleksją. Standard pozwala modyfikować sposób wyświetlania tekstu na ekranie – np. wyróżniać określone kombinacje liter.

EPUB, jak już zauważyliśmy, daje wydawcy możliwość zainstalowania ochrony przed kopiowaniem. Sprzedawcy e-booków w razie potrzeby mogą korzystać ich mechanizmy ograniczające dostęp do dokumentu. W tym celu należy zmodyfikować plik Rights.xml znajdujący się w archiwum.

Ograniczenia

Aby utworzyć publikację EPUB, musisz znać składnię XML, XHTML i CSS. W takim przypadku musisz pracować z dużą liczbą identyfikatorów. Dla porównania to samo Standard FB2 zawiera jedynie minimalny wymagany zestaw tagów - wystarczający do układu fikcji. I tworzyć Dokumenty PDF Nie jest wymagana żadna specjalna wiedza – za wszystko odpowiada specjalistyczne oprogramowanie.

EPUB jest również krytykowany za złożoność projektu komiksów i innych książek z wieloma ilustracjami. W takim przypadku wydawca musi stworzyć statyczny układ ze stałymi współrzędnymi dla każdego obrazu – może to zająć dużo wysiłku i czasu.

Co dalej

IDPF pracuje obecnie nad nowymi specyfikacjami formatu. Na przykład jeden z nich pomoże Ci stworzyć interaktywne tutoriale z ukrytymi sekcjami. Ta sama książka będzie wyglądać inaczej dla nauczyciela i ucznia – w drugim przypadku np. odpowiedzi na testy lub pytania kontrolne zostaną ukryte.

Książki elektroniczne i ich formaty: mowa o EPUB-ie – jego historii, zaletach i wadach
Obrazek: Guian Bolisay. / CC BY-SA

Oczekuje się, że nowa funkcja pomoże w reorganizacji procesu edukacyjnego. Dziś EPUB jest dość aktywnie wykorzystywany przez duże uniwersytety, na przykład Uniwersytet Oksfordzki. Kilka lat temu oni dodany Obsługa formatu EPUB 3.0 w aplikacji biblioteki cyfrowej.

IDPF tworzy także specyfikację implementacji przypisów Open Adnotation w formacie EPUB. Standard ten został opracowany przez W3C w 2013 roku - upraszcza pracę ze złożonymi typami adnotacji. Można go na przykład użyć do dodania notatki do określonej sekcji obrazu JPEG. Opcja standardowa wdraża mechanizm synchronizowanie zmian w adnotacjach pomiędzy kopiami tego samego dokumentu EPUB. Otwórz notatki w formacie adnotacji Możesz dodać do plików EPUB już teraz, ale formalna specyfikacja dla nich nie została jeszcze przyjęta.

Trwają także prace nad nową wersją standardu – EPUB 3.2. Będzie zawierał formaty WOW 2.0 и SFNT, które służą do kompresji czcionek (w niektórych przypadkach mogą zmniejszyć rozmiar pliku o 30%). Programiści zastąpią także niektóre przestarzałe atrybuty HTML. Na przykład zamiast osobnego elementu wyzwalającego do aktywacji plików audio i wideo, nowy standard będzie zawierał natywne elementy audio i wideo HTML.

Projekt specyfikacje и Lista zmian są już dostępne w repozytorium W3C GitHub.

Recenzje e-czytników ONYX-BOOX:

Źródło: www.habr.com

Dodaj komentarz