E-libroj kaj iliaj formatoj: FB2 kaj FB3 - historio, avantaĝoj, malavantaĝoj kaj principoj de laboro

En la antaŭa artikolo ni parolis pri trajtoj de la formato DjVu. Hodiaŭ ni decidis koncentriĝi pri la formato FictionBook2, pli konata kiel FB2, kaj ĝia "posteulo" FB3.

E-libroj kaj iliaj formatoj: FB2 kaj FB3 - historio, avantaĝoj, malavantaĝoj kaj principoj de laboro
/flickr/ Judit Klein / CC

La aspekto de la formato

Meze de la 90-aj jaroj, entuziasmuloj komenciĝis ciferecigi sovetiajn librojn. Ili tradukis kaj konservis literaturon en plej diversaj formatoj. Unu el la unuaj bibliotekoj en Runet - Biblioteko de Maxim Moshkov - uzis formatitan tekstdosieron (TXT).

La elekto estis farita en sia favoro pro ĝia rezisto al bajta korupto kaj ĉiuflankeco - TXT malfermiĝas sur iu ajn operaciumo. Tamen, li malfaciligis ĝin prilaborado de stokitaj tekstaj informoj. Ekzemple, por moviĝi al la mila linio, 999 linioj antaŭ ĝi devis esti prilaboritaj. Libroj ankaŭ stokita en Word dokumentoj kaj PDF - ĉi-lasta estis malfacile konverti al aliaj formatoj, kaj malfortaj komputiloj malfermiĝis kaj montrata PDF-dokumentoj kun malfruoj.

HTML ankaŭ estis uzata por "stoki" elektronikan literaturon. Ĝi faciligis indeksadon, konvertiĝon al aliaj formatoj kaj kreadon de dokumentoj (etikedado de teksto), sed ĝi enkondukis siajn proprajn mankojn. Unu el la plej signifaj estis "malprecizeco» normo: ĝi permesis certajn liberecojn dum skribado de etikedoj. Kelkaj el ili devis esti fermitaj, aliaj (ekzemple, ) - ne necesis fermi ĝin. La etikedoj mem povus havi arbitran nestan ordon.

Kaj kvankam tia laboro kun dosieroj ne estis instigita - tiaj dokumentoj estis konsiderataj malĝustaj - la normo postulis legantojn provi montri la enhavon. Ĉi tie aperis malfacilaĵoj, ĉar en ĉiu aplikaĵo la procezo de "diveni" estis efektivigita laŭ sia propra maniero. Al la sama tempo, la legado-aparatoj kaj aplikoj disponeblaj en la merkato en tiu tempo komprenis unu aŭ du specialigitaj formatoj. Se libro estis havebla en unu formato, ĝi devis esti reformita por esti legita. Oni intencis solvi ĉiujn ĉi tiujn mankojn FikcioLibro2, aŭ FB2, kiu transprenis la komencan "kobadon" de la teksto kaj konvertiĝo.

Notu, ke la formato havis sian unuan version - FikcioLibro1 - tamen ĝi estis nur eksperimenta en naturo, ne daŭris longe, estas nuntempe ne subtenata kaj ne estas retrokongrua. Tial FictionBook plej ofte signifas sian "posteulo" - la FB2-formato.

FB2 estis kreita de grupo de programistoj gvidataj de Dmitrij Gribov, kiu estas la teknika direktoro de la litrofirmao, kaj Miĥail Matsnev, la kreinto de la Haali Reader. La formato baziĝas sur XML, kiu reguligas laboron kun nefermitaj kaj nestitaj etikedoj pli strikte ol HTML. XML-dokumento estas akompanata de tiel nomata XML-skemo. XML-skemo estas speciala dosiero, kiu enhavas ĉiujn etikedojn kaj priskribas la regulojn por ilia uzo (sekvenco, nestado, deviga kaj laŭvola, ktp.). En FictionBook, la diagramo estas en la dosiero FictionBook2.xsd. Ekzempla XML-skemo troveblas ĉe ligilo (ĝi estas uzata de la litroj e-librovendejo).

FB2-dokumentstrukturo

Teksto en dokumento estas konservita en specialaj etikedoj - elementoj de alineaj tipoj: , Kaj . Estas ankaŭ elemento , kiu ne havas enhavon kaj estas uzata por enmeti breĉojn.

Ĉiuj dokumentoj komenciĝas per radika etikedo , sub kiu povas aperi , , Kaj .

Etikedo enhavas stilfoliojn por faciligi konvertiĝon al aliaj formatoj. EN mensogo kodita uzante bazo64 datumoj kiuj povas esti bezonataj por redoni la dokumenton.

Elemento enhavas ĉiujn necesajn informojn pri la libro: ĝenro de la verko, listo de aŭtoroj (plena nomo, retadreso kaj retejo), titolo, bloko kun ŝlosilvortoj, komentario. Ĝi ankaŭ povas enhavi informojn pri ŝanĝoj faritaj al la dokumento kaj informoj pri la eldonisto de la libro se ĝi estis eldonita surpapere.

Jen kiel aspektas parto de la bloko en la enskribo FictionBook por funkcias "Studo en Skarlato" de Arthur Conan Doyle, prenita de Projekto Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

La ŝlosila komponanto de FictionBook-dokumento estas . Ĝi enhavas la tekston de la libro mem. Povas esti pluraj el tiuj etikedoj tra la dokumento - kromaj blokoj estas uzataj por konservi piednotojn, komentojn kaj notojn.

FictionBook ankaŭ disponigas plurajn etikedojn por labori kun hiperligiloj. Ili baziĝas sur la specifo XLink, evoluigita fare de la konsorcio W3C specife por krei ligilojn inter malsamaj rimedoj en XML-dokumentoj.

Avantaĝoj de la formato

La FB2-normo inkluzivas nur la minimuman postulatan aron de etikedoj (sufiĉaj por "dezajni" fikcion), kiu simpligas ĝian prilaboradon de legantoj. Krome, en la kazo de rekta funkciado de la leganto kun la formato FB, la uzanto havas la ŝancon personecigi preskaŭ ĉiujn ekranajn parametrojn.

La strikta strukturo de la dokumento permesas vin aŭtomatigi la procezon de konvertiĝo de FB-formato al iu ajn alia. La sama strukturo ebligas labori kun unuopaj elementoj de dokumentoj - starigu filtrilojn laŭ libroaŭtoroj, titolo, ĝenro, ktp. Tial la FB2-formato akiris popularecon en Runet, iĝante la defaŭlta normo en rusaj elektronikaj bibliotekoj kaj bibliotekoj. en la CIS-landoj.

Malavantaĝoj de la formato

La simpleco de la FB2-formato estas ĝia avantaĝo kaj malavantaĝo samtempe. Ĉi tio limigas la funkciecon por kompleksa teksta aranĝo (ekzemple, notoj en la marĝenoj). Ĝi ne havas vektorajn grafikojn aŭ subtenon por numeritaj listoj. Tial la formato ne tre taŭga por lernolibroj, konsultlibroj kaj teknika literaturo (la nomo de la formato eĉ parolas pri tio - fikcia libro, aŭ "fikcia libro").

Samtempe, por montri minimumajn informojn pri la libro - titolo, aŭtoro kaj kovrilo - la programo bezonas pretigi preskaŭ la tutan XML-dokumenton. Ĉi tio estas ĉar metadatenoj venas komence de la teksto kaj bildoj venas ĉe la fino.

FB3 - formata evoluo

Pro pliigitaj postuloj por formatado de librotekstoj (kaj por mildigi kelkajn el la mankoj de FB2), Gribov komencis labori pri la FB3-formato. Evoluo poste ĉesis, sed en 2014 ĝi estis rekomencis.

Laŭ la aŭtoroj, ili studis la verajn bezonojn dum eldonado de teknika literaturo, rigardis lernolibrojn, konsultlibrojn, manlibrojn kaj skizis pli specifan aron da etikedoj, kiuj permesus montri ajnan libron.

En la nova specifo, la formato FictionBook estas zip-arkivo en kiu metadatenoj, bildoj kaj teksto estas konservitaj kiel apartaj dosieroj. Postuloj por la zip-dosierformato kaj konvencioj por ĝia organizo estas specifitaj en la normo ECMA-376, kiu difinas Open XML.

Kelkaj plibonigoj estis faritaj rilate al formatado (interspaco, substrekado) kaj nova objekto estis aldonita - "bloko" - kiu formatas arbitran fragmenton de libro en la formo de kvarangulo kaj povas esti enigita en tekston kun envolvaĵo. Nun ekzistas subteno por numeritaj kaj kuglolistoj.

FB3 estas distribuita sub libera permesilo kaj estas malferma fonto, do ĉiuj utilecoj estas disponeblaj por eldonejoj kaj uzantoj: konvertiloj, nubaj redaktantoj, legantoj. Nuna versio formato, leganto и la redaktoro troveblas en la GitHub-deponejo de la projekto.

Ĝenerale, FictionBook3 estas ankoraŭ malpli disvastigita ol sia pli maljuna frato, sed pluraj elektronikaj bibliotekoj jam ofertas librojn en tiu ĉi formato. Kaj litroj antaŭ kelkaj jaroj anoncis sian intencon translokigi sian tutan katalogon al nova formato. Iuj legantoj jam subtenas ĉiujn necesajn FB3-funkciojn. Ekzemple, ĉiuj modernaj modeloj de ONYX-legantoj povas funkcii kun ĉi tiu formato el la skatolo, ekzemple, Darwin 3Kleopatro 3.

E-libroj kaj iliaj formatoj: FB2 kaj FB3 - historio, avantaĝoj, malavantaĝoj kaj principoj de laboro
/ ONIkso-KUSTO Kleopatro 3

Pli larĝa distribuo de FictionBook3 kreos ekosistemon orientita por plene kaj efike labori kun teksto sur ajna aparato kun limigitaj rimedoj: nigrablanka aŭ malgranda ekrano, malalta memoro, ktp. Laŭ la programistoj, libro iam aranĝita estos kiel eble plej oportuna en ajna medio.

PS Ni atentigas pri vi plurajn recenzojn pri legantoj de ONYX BOOX:



fonto: www.habr.com

Aldoni komenton