Elektroninės knygos ir jų formatai: FB2 ir FB3 - istorija, privalumai, trūkumai ir veikimo principai

Ankstesniame straipsnyje mes kalbėjome apie DjVu formato ypatybės. Šiandien nusprendėme sutelkti dėmesį į FictionBook2 formatą, geriau žinomą kaip FB2, ir jo „įpėdinį“ FB3.

Elektroninės knygos ir jų formatai: FB2 ir FB3 - istorija, privalumai, trūkumai ir veikimo principai
/flickr/ Judita Klein / CC

Formato išvaizda

90-ųjų viduryje entuziastai pradėjo suskaitmeninti sovietines knygas. Jie vertė ir saugojo įvairiausių formatų literatūrą. Viena pirmųjų Runet bibliotekų - Maksimo Moškovo biblioteka - naudojamas suformatuotas tekstinis failas (TXT).

Pasirinkimas buvo pasirinktas dėl atsparumo baitų pažeidimams ir universalumo – TXT atsidaro bet kurioje operacinėje sistemoje. Tačiau jis apsunkino saugomos tekstinės informacijos apdorojimas. Pavyzdžiui, norint pereiti į tūkstantąją eilutę, prieš ją reikia apdoroti 999 eilutes. Knygos taip pat saugomi Word dokumentuose ir PDF – pastarąjį buvo sunku konvertuoti į kitus formatus, o silpni kompiuteriai atsidarė ir rodomas PDF dokumentai su vėlavimu.

HTML taip pat buvo naudojamas elektroninei literatūrai „saugoti“. Tai palengvino indeksavimą, konvertavimą į kitus formatus ir dokumentų kūrimą (teksto žymėjimą), tačiau atsirado savų trūkumų. Vienas reikšmingiausių buvo „neapibrėžtumas» standartas: leido tam tikras laisves rašant žymas. Vieni iš jų turėjo būti uždaryti, kiti (pvz. ) – nereikėjo jo uždaryti. Pačios žymos gali turėti savavališką įdėjimo tvarką.

Ir nors toks darbas su failais nebuvo skatinamas – tokie dokumentai buvo laikomi neteisingais – standartas reikalavo, kad skaitytojai stengtųsi atvaizduoti turinį. Čia ir kilo sunkumų, nes kiekvienoje programoje „spėjimo“ procesas buvo įgyvendintas savaip. Tuo pačiu metu tuo metu rinkoje esantys skaitymo įrenginiai ir programos Supratau vienas ar du specializuoti formatai. Jei knyga buvo prieinama vienu formatu, norint ją skaityti, ją reikėjo suformatuoti iš naujo. Juo buvo siekiama pašalinti visus šiuos trūkumus Grožinės literatūros knyga2, arba FB2, kuris perėmė pradinį teksto „šukavimą“ ir konvertavimą.

Atminkite, kad formatas turėjo pirmąją versiją - Grožinės literatūros knyga1 - tačiau jis buvo tik eksperimentinio pobūdžio, truko neilgai, šiuo metu nepalaikomas ir nesuderinamas atgal. Todėl „FictionBook“ dažniausiai reiškia jos „įpėdinį“ - FB2 formatą.

FB2 sukūrė kūrėjų grupė, vadovaujama Dmitrijus Gribovas, kuris yra litrų įmonės techninis direktorius, ir Michailas Matsnevas, Haali Reader kūrėjas. Formatas pagrįstas XML, kuris griežčiau nei HTML reguliuoja darbą su neuždarytomis ir įdėtomis žymomis. Prie XML dokumento pridedama vadinamoji XML schema. XML schema yra specialus failas, kuriame yra visos žymos ir aprašomos jų naudojimo taisyklės (seka, įdėjimas, privalomas ir neprivalomas ir kt.). „FictionBook“ diagrama yra faile FictionBook2.xsd. XML schemos pavyzdį galite rasti adresu nuoroda (jį naudoja litrų el. knygų parduotuvė).

FB2 dokumento struktūra

Tekstas dokumente saugoma specialiose žymose - pastraipų tipų elementai: , Ir . Taip pat yra elementas , kuris neturi turinio ir naudojamas tarpams įterpti.

Visi dokumentai prasideda šaknies žyma , po kuria gali pasirodyti , , Ir .

Žyma yra stiliaus lapų, palengvinančių konvertavimą į kitus formatus. IN melas užkoduotas naudojant base64 duomenys, kurių gali prireikti norint pateikti dokumentą.

Elementas yra visa reikalinga informacija apie knygą: kūrinio žanras, autorių sąrašas (vardas, pavardė, el. pašto adresas ir svetainė), pavadinimas, blokas su raktiniais žodžiais, anotacija. Jame taip pat gali būti informacijos apie dokumento pakeitimus ir informaciją apie knygos leidėją, jei ji buvo išleista popieriuje.

Taip atrodo bloko dalis grožinės literatūros knygos įraše darbai Arthuro Conano Doyle'o „Studija raudona spalva“, paimta iš Projektas Gutenbergas:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Pagrindinis „FictionBook“ dokumento komponentas yra . Jame yra pats knygos tekstas. Šių žymų visame dokumente gali būti kelios – papildomi blokai naudojami išnašoms, komentarams ir pastaboms saugoti.

„FictionBook“ taip pat pateikia keletą žymų, skirtų darbui su hipersaitais. Jie yra pagrįsti specifikacijomis XLink, kurį sukūrė konsorciumas W3C specialiai skirtų sąsajoms tarp skirtingų XML dokumentų išteklių kurti.

Formato privalumai

FB2 standartas apima tik minimalų reikalingą žymų rinkinį (pakankamą fantastikai „sukurti“, o tai supaprastina skaitytojų apdorojimą). Be to, jei skaitytuvas tiesiogiai veikia FB formatu, vartotojas turi galimybę tinkinti beveik visus rodymo parametrus.

Griežta dokumento struktūra leidžia automatizuoti konvertavimo iš FB formato į bet kurį kitą procesą. Ta pati struktūra leidžia dirbti su atskirais dokumentų elementais – nustatyti filtrus pagal knygų autorius, pavadinimą, žanrą ir kt. Dėl šios priežasties FB2 formatas išpopuliarėjo „Runet“ ir tapo numatytuoju standartu Rusijos elektroninėse bibliotekose ir bibliotekose. NVS šalyse.

Formato trūkumai

FB2 formato paprastumas yra jo privalumas ir trūkumas tuo pačiu metu. Tai apriboja sudėtingo teksto išdėstymo (pavyzdžiui, pastabų paraštėse) funkcionalumą. Jame nėra vektorinės grafikos arba numeruotų sąrašų palaikymo. Dėl šios priežasties formatas nelabai tinka vadovėliams, žinynams ir techninei literatūrai (formato pavadinimas netgi kalba apie tai - grožinė knyga arba „grožinė knyga“).

Tuo pačiu, norint parodyti minimalią informaciją apie knygą – pavadinimą, autorių ir viršelį – programai reikia apdoroti beveik visą XML dokumentą. Taip yra todėl, kad metaduomenys pateikiami teksto pradžioje, o vaizdai – pabaigoje.

FB3 – formato kūrimas

Dėl padidėjusių reikalavimų knygų tekstų formatavimui (ir tam, kad būtų sušvelninti kai kurie FB2 trūkumai), Gribovas pradėjo dirbti su FB3 formatu. Vėliau plėtra sustojo, tačiau 2014 m atnaujintas.

Pasak autorių, jie ištyrė realius poreikius leidžiant techninę literatūrą, žiūrėjo vadovėlius, žinynus, žinynus ir nubrėžė konkretesnį etikečių rinkinį, kuris leistų rodyti bet kokią knygą.

Naujoje specifikacijoje „FictionBook“ formatas yra ZIP archyvas, kuriame metaduomenys, vaizdai ir tekstas saugomi kaip atskiri failai. Standarte nurodyti zip failo formato reikalavimai ir jo organizavimo taisyklės ECMA-376, kuris apibrėžia Open XML.

Buvo atlikta nemažai patobulinimų, susijusių su formatavimu (tarpais, pabraukimu), ir buvo pridėtas naujas objektas - „blokas“, kuris suformatuoja savavališką knygos fragmentą keturkampio pavidalu ir gali būti įterptas į tekstą su apvyniojimu. Dabar palaikomi sunumeruoti ir ženkleliais pažymėti sąrašai.

FB3 platinamas pagal nemokamą licenciją ir yra atvirojo kodo, todėl leidėjams ir vartotojams prieinamos visos komunalinės paslaugos: konverteriai, debesų redaktoriai, skaitytojai. Dabartinė versija formatas, skaitytojas и redaktorius galima rasti projekto GitHub saugykloje.

Apskritai „FictionBook3“ vis dar yra mažiau paplitusi nei jo vyresnysis brolis, tačiau kelios elektroninės bibliotekos jau siūlo šio formato knygas. O litrai prieš porą metų paskelbė apie ketinimą perkelti visą savo katalogą į naują formatą. Kai kurie skaitytojai jau palaiko visas būtinas FB3 funkcijas. Pavyzdžiui, visi šiuolaikiniai ONYX skaitytuvų modeliai gali dirbti su šiuo formatu, pavyzdžiui, Darvinas 3 arba Kleopatra 3.

Elektroninės knygos ir jų formatai: FB2 ir FB3 - istorija, privalumai, trūkumai ir veikimo principai
/ ONYX BOOX Kleopatra 3

Platesnis FictionBook3 platinimas sukurs ekosistemą orientuotas pilnai ir efektyviai dirbti su tekstu bet kuriame įrenginyje, turinčiame ribotus išteklius: nespalvotą arba mažą ekraną, mažą atmintį ir pan. Kūrėjų teigimu, vieną kartą išdėliota knyga bus kuo patogesnė bet kokioje aplinkoje.

PS Atkreipiame jūsų dėmesį į keletą ONYX BOOX skaitytuvų apžvalgų:



Šaltinis: www.habr.com

Добавить комментарий