E-kirjat ja niiden muodot: FB2 ja FB3 - historia, plussat, miinukset ja työn periaatteet

Edellisessä artikkelissa puhuimme DjVu-muodon ominaisuuksia. Tänään päätimme keskittyä FictionBook2-muotoon, joka tunnetaan paremmin nimellä FB2, ja sen "seuraajaan" FB3.

E-kirjat ja niiden muodot: FB2 ja FB3 - historia, plussat, miinukset ja työn periaatteet
/flickr/ Judit Klein / CC

Muodin ulkonäkö

90-luvun puolivälissä harrastajat aloitimme digitoida Neuvostoliiton kirjoja. He käänsivät ja säilyttivät kirjallisuutta monissa eri muodoissa. Yksi ensimmäisistä Runetin kirjastoista - Maxim Moshkov -kirjasto - käytti muotoiltua tekstitiedostoa (TXT).

Valinta tehtiin sen eduksi, koska se kestää tavujen korruptiota ja monipuolisuutta - TXT avautuu missä tahansa käyttöjärjestelmässä. Kuitenkin hän teki sen vaikeaksi tallennettujen tekstitietojen käsittely. Esimerkiksi tuhannelle riville siirtyminen edellyttää sitä edeltävän 999 rivin käsittelyä. Kirjoja myös tallennettu Word-asiakirjoissa ja PDF:ssä - jälkimmäistä oli vaikea muuntaa muihin muotoihin, ja heikot tietokoneet avautuivat ja näytetään PDF-dokumentit viiveellä.

HTML:ää käytettiin myös sähköisen kirjallisuuden "tallennustamiseen". Se helpotti indeksointia, muuntamista muihin muotoihin ja asiakirjojen luomista (tekstin merkitseminen), mutta toi omat puutteensa. Yksi merkittävimmistä oli "epämääräisyyttä» standardi: se salli tiettyjä vapauksia tunnisteiden kirjoittamisessa. Jotkut niistä piti sulkea, toiset (esim. ) - sitä ei tarvinnut sulkea. Tunnisteilla voi olla mielivaltainen sisäkkäisjärjestys.

Ja vaikka tällaista tiedostojen kanssa työskentelyä ei kannustettu - tällaisia ​​asiakirjoja pidettiin virheellisinä - standardi edellytti lukijoiden yrittävän näyttää sisältöä. Tässä syntyi vaikeuksia, koska jokaisessa sovelluksessa "arvaus" toteutettiin omalla tavallaan. Samaan aikaan markkinoilla olevat lukulaitteet ja -sovellukset ymmärsi yksi tai kaksi erikoismuotoa. Jos kirja oli saatavilla yhdessä muodossa, se piti muotoilla uudelleen, jotta sitä voi lukea. Sen oli tarkoitus korjata kaikki nämä puutteet Fiktiokirja 2, tai FB2, joka otti vastuulleen tekstin alkuperäisen "kampauksen" ja muuntamisen.

Huomaa, että muodolla oli ensimmäinen versio - Fiktiokirja 1 - Se oli kuitenkin vain kokeellista, ei kestänyt kauan, sitä ei tueta tällä hetkellä eikä se ole taaksepäin yhteensopiva. Siksi FictionBook tarkoittaa useimmiten sen "seuraajaa" - FB2-muotoa.

FB2:n loi kehittäjäryhmä, jota johti Dmitri Gribov, joka on litrayhtiön tekninen johtaja, ja Mihail Matsnev, Haali Readerin luoja. Muoto perustuu XML:ään, joka säätelee sulkemattomien ja sisäkkäisten tagien käyttöä tiukemmin kuin HTML:ää. XML-dokumentin mukana on ns. XML-skeema. XML-skeema on erityinen tiedosto, joka sisältää kaikki tunnisteet ja kuvaa niiden käytön säännöt (sekvenssi, sisäkkäisyys, pakollinen ja valinnainen jne.). FictionBookissa kaavio on tiedostossa FictionBook2.xsd. Esimerkki XML-skeemasta löytyy osoitteesta linkki (se on litran e-kirjakaupan käytössä).

FB2-asiakirjan rakenne

Teksti asiakirjassa хранится erikoistunnisteissa - kappaletyyppien elementit: , Ja . Siellä on myös elementti , jolla ei ole sisältöä ja jota käytetään aukkojen lisäämiseen.

Kaikki asiakirjat alkavat juuritunnisteella , jonka alapuolella saattaa näkyä , , Ja .

Tag sisältää tyylisivuja, jotka helpottavat muuntamista muihin muotoihin. SISÄÄN valhe koodattu käyttäen base64 tiedot, joita saatetaan tarvita asiakirjan hahmontamiseen.

Elementti sisältää kaikki tarvittavat tiedot kirjasta: teoksen genre, tekijöiden luettelo (koko nimi, sähköpostiosoite ja verkkosivusto), nimi, avainsanalohko, huomautus. Se voi sisältää myös tietoja dokumenttiin tehdyistä muutoksista ja tietoja kirjan kustantajasta, jos se on julkaistu paperilla.

Tältä lohkon osa näyttää FictionBook-merkinnässä toimii Arthur Conan Doylen "Study in Scarlet", otettu kohteesta Projekti Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

FictionBook-dokumentin avainkomponentti on . Se sisältää itse kirjan tekstin. Näitä tunnisteita voi olla useita koko asiakirjassa - lisälohkoja käytetään alaviitteiden, kommenttien ja huomautusten tallentamiseen.

FictionBook tarjoaa myös useita tunnisteita hyperlinkkien käsittelyä varten. Ne perustuvat spesifikaatioon XLink, jonka konsortio on kehittänyt W3C erityisesti linkkien luomiseen XML-dokumenttien eri resurssien välille.

Muodin edut

FB2-standardi sisältää vain vähimmäismäärän tunnisteita (riittää "suunnittelemaan" fiktiota), mikä yksinkertaistaa sen käsittelyä lukijoiden toimesta. Lisäksi, jos lukijaa käytetään suoraan FB-muodossa, käyttäjällä on mahdollisuus mukauttaa melkein kaikkia näyttöparametreja.

Asiakirjan tiukka rakenne antaa sinun automatisoida muuntamisen FB-muodosta mihin tahansa muuhun. Sama rakenne mahdollistaa asiakirjojen yksittäisten elementtien kanssa työskentelyn - suodattimien määrittäminen kirjantekijöiden, otsikon, tyylilajin jne. mukaan. Tästä syystä FB2-muoto on saavuttanut suosiota Runetissa, ja siitä on tullut oletusstandardi Venäjän sähköisissä kirjastoissa ja kirjastoissa IVY-maissa.

Muodin haitat

FB2-muodon yksinkertaisuus on sen etu ja haitta yhtä aikaa. Tämä rajoittaa monimutkaisen tekstin asettelun toimivuutta (esimerkiksi huomautuksia marginaaleissa). Siinä ei ole vektorigrafiikkaa tai tukea numeroituille luetteloille. Tästä syystä muoto ei kovin sopiva oppikirjoille, hakuteoksille ja tekniselle kirjallisuudelle (muodon nimi jopa puhuu tästä - fiktiokirja tai "fiktiokirja").

Samaan aikaan, jotta se näyttää mahdollisimman vähän tietoa kirjasta - nimi, tekijä ja kansi - ohjelman on käsiteltävä lähes koko XML-dokumentti. Tämä johtuu siitä, että metatiedot tulevat tekstin alkuun ja kuvat lopussa.

FB3 - formaatin kehitys

Kirjatekstien muotoiluvaatimusten lisääntymisen vuoksi (ja joidenkin FB2:n puutteiden lieventämiseksi) Gribov aloitti työskentelyn FB3-muodon parissa. Kehitys pysähtyi myöhemmin, mutta vuonna 2014 se oli jatkettiin.

Kirjoittajien mukaan he tutkivat todellisia tarpeita julkaiseessaan teknistä kirjallisuutta, katsoivat oppikirjoja, hakukirjoja, käsikirjoja ja hahmottelivat tarkemman merkinnän, jonka avulla mikä tahansa kirja voidaan näyttää.

Uudessa määrittelyssä FictionBook-muoto on zip-arkisto, johon metatiedot, kuvat ja teksti tallennetaan erillisinä tiedostoina. Zip-tiedostomuodon vaatimukset ja sen organisaation käytännöt on määritelty standardissa ECMA-376, joka määrittää Open XML:n.

Muotoiluun (välit, alleviivaukset) tehtiin useita parannuksia ja lisättiin uusi objekti - "lohko" - joka muotoilee mielivaltaisen kirjan katkelman nelikulmion muotoon ja voidaan upottaa tekstiin ääriviivalla. Numeroidut ja luettelomerkityt luettelot ovat nyt tuettuja.

FB3 jaetaan ilmaisella lisenssillä ja on avoimen lähdekoodin, joten kaikki apuohjelmat ovat julkaisijoiden ja käyttäjien saatavilla: muuntajat, pilvieditorit, lukijat. Nykyinen versio muoto, lukija и toimittaja löytyy projektin GitHub-arkistosta.

Yleisesti ottaen FictionBook3 on edelleen vähemmän levinnyt kuin sen vanhempi veli, mutta useat sähköiset kirjastot tarjoavat jo kirjoja tässä muodossa. Litrat ilmoittivat pari vuotta sitten aikovansa siirtää koko luettelonsa uuteen muotoon. Jotkut lukijat tukevat jo kaikkia tarvittavia FB3-toimintoja. Esimerkiksi kaikki nykyaikaiset ONYX-lukijoiden mallit voivat toimia tämän muodon kanssa heti valmiina, esimerkiksi Darwin 3 tai Kleopatra 3.

E-kirjat ja niiden muodot: FB2 ja FB3 - historia, plussat, miinukset ja työn periaatteet
/ ONYX BOOX Cleopatra 3

FictionBook3:n laajempi jakelu luo ekosysteemin suuntautunut työskennellä täysin ja tehokkaasti tekstin kanssa millä tahansa laitteella, jolla on rajoitetut resurssit: mustavalkoinen tai pieni näyttö, vähän muistia jne. Kehittäjien mukaan kirja on kerran asennettuna mahdollisimman kätevä missä tahansa ympäristössä.

PS Tuomme huomiosi useita arvosteluja ONYX BOOX -lukijoista:



Lähde: will.com

Lisää kommentti