E-boeke en hul formate: FB2 en FB3 - geskiedenis, voordele, nadele en beginsels van werk

In die vorige artikel het ons gepraat oor kenmerke van die DjVu-formaat. Ons het vandag besluit om te fokus op die FictionBook2-formaat, beter bekend as FB2, en sy “opvolger” FB3.

E-boeke en hul formate: FB2 en FB3 - geskiedenis, voordele, nadele en beginsels van werk
/flickr/ Judit Klein / CC

Die voorkoms van die formaat

In die middel-90's, entoesiaste begin Sowjet-boeke te digitaliseer. Hulle het literatuur in 'n wye verskeidenheid formate vertaal en bewaar. Een van die eerste biblioteke in Runet - Biblioteek van Maxim Moshkov - het 'n geformateerde tekslêer (TXT) gebruik.

Die keuse is in sy guns gemaak weens sy weerstand teen greepkorrupsie en veelsydigheid - TXT maak op enige bedryfstelsel oop. Hy het egter het dit moeilik gemaak verwerking van gestoorde teksinligting. Byvoorbeeld, om na die duisendste reël te beweeg, moes 999 reëls wat dit voorafgaan, verwerk word. Boeke ook gestoor word in Word-dokumente en PDF - laasgenoemde was moeilik om na ander formate om te skakel, en swak rekenaars het oopgemaak en vertoon PDF-dokumente met vertragings.

HTML is ook gebruik om elektroniese literatuur te "berg". Dit het indeksering, omskakeling na ander formate en dokumentskepping (merk teks) makliker gemaak, maar dit het sy eie tekortkominge ingebring. Een van die belangrikste was “vaagheid» standaard: dit het sekere vryhede toegelaat wanneer etikette geskryf word. Sommige van hulle moes gesluit word, ander (bv. ) - dit was nie nodig om dit toe te maak nie. Die etikette self kan 'n arbitrêre nesvolgorde hê.

En hoewel sulke werk met lêers nie aangemoedig is nie – sulke dokumente is as verkeerd beskou – het die standaard vereis dat lesers die inhoud probeer vertoon. Dit is waar probleme ontstaan ​​​​het, aangesien die proses van "raai" in elke toepassing op sy eie manier geïmplementeer is. Terselfdertyd, die leestoestelle en toepassings wat op daardie tydstip op die mark beskikbaar was verstaan een of twee gespesialiseerde formate. As 'n boek in een formaat beskikbaar was, moes dit herformateer word om gelees te word. Dit was bedoel om al hierdie tekortkominge op te los Fiksieboek 2, of FB2, wat die aanvanklike "kam" van die teks en omskakeling oorgeneem het.

Let daarop dat die formaat sy eerste weergawe gehad het - Fiksieboek 1 - dit was egter net eksperimenteel van aard, het nie lank gehou nie, word tans nie ondersteun nie en is nie terugwaarts versoenbaar nie. Daarom beteken FictionBook meestal sy "opvolger" - die FB2-formaat.

FB2 is geskep deur 'n groep ontwikkelaars onder leiding van Dmitri Gribov, wat die tegniese direkteur van die litermaatskappy is, en Mikhail Matsnev, die skepper van die Haali Reader. Die formaat is gebaseer op XML, wat werk met ongeslote en geneste etikette strenger reguleer as HTML. 'n XML-dokument word vergesel van 'n sogenaamde XML-skema. 'n XML-skema is 'n spesiale lêer wat al die etikette bevat en die reëls vir hul gebruik beskryf (volgorde, nes, verpligtend en opsioneel, ens.). In FictionBook is die diagram in die lêer FictionBook2.xsd. 'n Voorbeeld XML-skema kan gevind word by skakel (dit word deur die liters e-boekwinkel gebruik).

FB2 dokumentstruktuur

Teks in dokument gehou in spesiale etikette - elemente van paragraaftipes: , En . Daar is ook 'n element , wat geen inhoud het nie en gebruik word om gapings in te voeg.

Alle dokumente begin met 'n wortelmerker , hieronder kan verskyn , , En .

Merk bevat stylblaaie om omskakeling na ander formate te vergemaklik. IN lê geënkodeer met behulp van basis64 data wat nodig mag wees om die dokument weer te gee.

Element bevat al die nodige inligting oor die boek: genre van die werk, lys skrywers (volle naam, e-posadres en webwerf), titel, blok met sleutelwoorde, annotasie. Dit kan ook inligting bevat oor veranderinge wat aan die dokument gemaak is en inligting oor die uitgewer van die boek indien dit op papier gepubliseer is.

Dit is hoe deel van die blok lyk in die FictionBook-inskrywing vir werk "A Study in Scarlet" deur Arthur Conan Doyle, geneem uit Projek Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Die sleutelkomponent van 'n FictionBook-dokument is . Dit bevat die teks van die boek self. Daar kan verskeie van hierdie merkers regdeur die dokument wees - bykomende blokke word gebruik om voetnote, opmerkings en notas te stoor.

FictionBook verskaf ook verskeie merkers om met hiperskakels te werk. Hulle is gebaseer op die spesifikasie XLink, ontwikkel deur die konsortium W3C spesifiek vir die skep van skakels tussen verskillende hulpbronne in XML-dokumente.

Voordele van die formaat

Die FB2-standaard bevat slegs die minimum vereiste stel etikette (voldoende om fiksie te “ontwerp”, wat die verwerking daarvan deur lesers vergemaklik. Verder, in die geval van direkte werking van die leser met die FB-formaat, het die gebruiker die geleentheid om byna alle vertoonparameters aan te pas.

Die streng struktuur van die dokument laat jou toe om die proses van omskakeling van FB-formaat na enige ander te outomatiseer. Dieselfde struktuur maak dit moontlik om met individuele elemente van dokumente te werk - stel filters op volgens boekskrywers, titel, genre, ens. Om hierdie rede het die FB2-formaat gewild geword in Runet, en word die verstekstandaard in Russiese elektroniese biblioteke en biblioteke in die GOS-lande.

Nadele van die formaat

Die eenvoud van die FB2-formaat is terselfdertyd sy voordeel en nadeel. Dit beperk die funksionaliteit vir komplekse teksuitleg (byvoorbeeld notas in die kantlyne). Dit het nie vektorgrafika of ondersteuning vir genommerde lyste nie. Om hierdie rede die formaat nie baie geskik nie vir handboeke, naslaanboeke en tegniese literatuur (die naam van die formaat spreek selfs hieroor - fiksieboek, of "fiksieboek").

Terselfdertyd, om minimale inligting oor die boek te vertoon - titel, skrywer en omslag - moet die program byna die hele XML-dokument verwerk. Dit is omdat metadata aan die begin van die teks kom en beelde aan die einde.

FB3 - formaat ontwikkeling

As gevolg van verhoogde vereistes vir die formatering van boektekste (en om sommige van die tekortkominge van FB2 te versag), het Gribov aan die FB3-formaat begin werk. Ontwikkeling het later opgehou, maar in 2014 was dit hervat.

Volgens die skrywers het hulle die werklike behoeftes bestudeer wanneer tegniese literatuur gepubliseer word, na handboeke, naslaanboeke, handleidings gekyk en 'n meer spesifieke stel etikette uiteengesit wat toelaat dat enige boek vertoon word.

In die nuwe spesifikasie is die FictionBook-formaat 'n zip-argief waarin metadata, beelde en teks as aparte lêers gestoor word. Vereistes vir die zip-lêerformaat en konvensies vir sy organisasie word in die standaard gespesifiseer ECMA-376, wat Open XML definieer.

'n Aantal verbeterings is aangebring met betrekking tot formatering (spasiëring, onderstreep) en 'n nuwe objek is bygevoeg - 'n "blok" - wat 'n arbitrêre fragment van 'n boek in die vorm van 'n vierhoek formateer en met 'n omvou in teks ingebed kan word. Daar is nou ondersteuning vir genommerde en kolpuntlyste.

FB3 word onder 'n gratis lisensie versprei en is oopbron, so alle nutsprogramme is beskikbaar vir uitgewers en gebruikers: omskakelaars, wolkredigeerders, lesers. Huidige die weergawe formaat, leser и die redakteur kan gevind word in die projek se GitHub-bewaarplek.

Oor die algemeen is FictionBook3 steeds minder wydverspreid as sy ouer broer, maar verskeie elektroniese biblioteke bied reeds boeke in hierdie formaat aan. En liters het 'n paar jaar gelede hul voorneme aangekondig om hul hele katalogus na 'n nuwe formaat oor te dra. Sommige lesers ondersteun reeds al die nodige FB3-funksionaliteit. Byvoorbeeld, alle moderne modelle van ONYX-lesers kan uit die boks met hierdie formaat werk, byvoorbeeld, Darwin 3 of Cleopatra 3.

E-boeke en hul formate: FB2 en FB3 - geskiedenis, voordele, nadele en beginsels van werk
/ ONYX BOOK Cleopatra 3

Wyer verspreiding van FictionBook3 sal 'n ekosisteem skep georiënteerd om volledig en effektief met teks op enige toestel met beperkte hulpbronne te werk: swart-en-wit of klein skerm, min geheue, ens. Volgens die ontwikkelaars sal 'n boek so handig as moontlik in enige omgewing wees, sodra dit uitgelê is.

NS Ons bring verskeie resensies van ONYX BOOX-lesers onder u aandag:



Bron: will.com

Voeg 'n opmerking