E-libro ug ang ilang mga format: FB2 ug FB3 - kasaysayan, pro, kontra ug prinsipyo sa trabaho

Sa miaging artikulo atong gihisgutan mga bahin sa DjVu format. Karon nakahukom kami nga ipunting ang format sa FictionBook2, nga mas nailhan nga FB2, ug ang "successor" niini nga FB3.

E-libro ug ang ilang mga format: FB2 ug FB3 - kasaysayan, pro, kontra ug prinsipyo sa trabaho
/flickr/ Judit Klein / CC

Ang dagway sa pormat

Sa tunga-tunga sa 90s, mga mahiligon nagsugod i-digitize ang mga libro sa Sobyet. Ilang gihubad ug gipreserbar ang literatura sa lain-laing porma. Usa sa unang mga librarya sa Runet - Library ni Maxim Moshkov - migamit ug format nga text file (TXT).

Ang pagpili gihimo pabor niini tungod sa iyang pagsukol sa byte nga korapsyon ug versatility - TXT abli sa bisan unsa nga operating system. Apan, siya naghimo niini nga lisud pagproseso sa gitipigan nga impormasyon sa teksto. Pananglitan, aron mobalhin sa ika-libong linya, 999 ka linya nga nag-una niini kinahanglang iproseso. Mga libro usab gitipigan sa mga dokumento sa Pulong ug PDF - ang naulahi lisud nga i-convert sa ubang mga format, ug ang huyang nga mga kompyuter giablihan ug gipakita Mga dokumento sa PDF nga adunay mga paglangan.

Ang HTML gigamit usab sa "pagtipig" sa elektronik nga literatura. Gipasayon ​​niini ang pag-indeks, pagkakabig ngadto sa ubang mga format, ug paghimo sa dokumento (tagging text) nga mas sayon, apan gipaila niini ang kaugalingon nga mga kakulangan. Usa sa labing hinungdanon mao ang "pagkawalay klaroΒ» sumbanan: kini nagtugot sa pipila ka mga kagawasan sa pagsulat sa mga tag. Ang uban kanila kinahanglang sirado, ang uban (pananglitan, ) - dili kinahanglan nga isira kini. Ang mga tag sa ilang kaugalingon mahimong adunay usa ka arbitraryong han-ay sa salag.

Ug bisan kung ang ingon nga trabaho sa mga file wala gidasig - ang ingon nga mga dokumento giisip nga dili husto - ang sukaranan nga gikinahanglan sa mga magbabasa aron sulayan nga ipakita ang sulud. Dinhi mitungha ang mga kalisud, tungod kay sa matag aplikasyon ang proseso sa "pagtag-an" gipatuman sa kaugalingon nga paagi. Sa parehas nga oras, ang mga aparato sa pagbasa ug mga aplikasyon nga magamit sa merkado nianang panahona nakasabot usa o duha ka espesyal nga mga format. Kon ang usa ka libro anaa sa usa ka pormat, kini kinahanglang i-reformat aron mabasa. Kini gituyo aron masulbad kining tanan nga mga kakulangan Libro sa Fiction2, o FB2, nga maoy mipuli sa unang β€œpagsuklay” sa teksto ug pagkakabig.

Timan-i nga ang format adunay una nga bersyon - Libro sa Fiction1 - bisan pa, kini usa lamang ka eksperimento sa kinaiyahan, wala magdugay, sa pagkakaron wala gisuportahan ug dili atrasado. Busa, ang FictionBook kasagaran nagpasabut nga "kapuli" - ang format sa FB2.

Ang FB2 gimugna sa usa ka grupo sa mga developers nga gipangulohan ni Dmitry Gribov, kinsa mao ang teknikal nga direktor sa kompanya sa litro, ug si Mikhail Matsnev, ang tiglalang sa Haali Reader. Ang pormat gibase sa XML, nga nag-regulate sa trabaho uban sa mga unclosed ug nested tag nga mas estrikto kaysa HTML. Ang usa ka XML nga dokumento giubanan sa usa ka gitawag nga XML Schema. Ang XML schema usa ka espesyal nga payl nga naglangkob sa tanang mga tag ug naghulagway sa mga lagda alang sa ilang paggamit (sequence, nesting, mandatory ug optional, etc.). Sa FictionBook, ang diagram anaa sa file FictionBook2.xsd. Usa ka pananglitan nga XML schema makita sa link (gigamit kini sa litro nga e-book store).

Ang istruktura sa dokumento sa FB2

Teksto sa dokumento gitipig sa mga espesyal nga tag - mga elemento sa mga tipo sa parapo: , Ug . Adunay usab usa ka elemento , nga walay sulod ug gigamit sa pagsal-ot sa mga kal-ang.

Ang tanan nga mga dokumento magsugod sa usa ka root tag , sa ubos nga mahimong makita , , Ug .

Tag adunay mga style sheet aron mapadali ang pagkakabig sa ubang mga format. SA bakak nga gi-encode gamit sukaranan64 data nga mahimong gikinahanglan sa paghubad sa dokumento.

elemento naglangkob sa tanang gikinahanglan nga impormasyon mahitungod sa libro: genre sa trabaho, listahan sa mga tagsulat (bug-os nga ngalan, email address ug website), titulo, block uban sa mga keyword, anotasyon. Mahimo usab kini nga adunay kasayuran bahin sa mga pagbag-o nga gihimo sa dokumento ug kasayuran bahin sa nagpatik sa libro kung kini gimantala sa papel.

Kini ang hitsura sa bahin sa bloke sa FictionBook entry para sa nagtrabaho "Usa ka Pagtuon sa Scarlet" ni Arthur Conan Doyle, gikuha gikan sa Proyekto Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Ang yawe nga bahin sa usa ka dokumento sa FictionBook mao ang . Naglangkob kini sa teksto sa libro mismo. Mahimong adunay daghan niini nga mga tag sa tibuok dokumento - dugang nga mga bloke ang gigamit sa pagtipig sa mga footnote, mga komentaryo ug mga nota.

Naghatag usab ang FictionBook og daghang mga tag alang sa pagtrabaho sa mga hyperlink. Gibase sila sa espesipikasyon XLink, gihimo sa consortium W3C ilabi na alang sa paghimo og mga link tali sa lain-laing mga kapanguhaan sa XML nga mga dokumento.

Mga bentaha sa porma

Ang FB2 nga sumbanan naglakip lamang sa minimum nga gikinahanglan nga set sa mga tag (igo sa "pagdesinyo" nga fiction), nga nagpasimple sa pagproseso niini sa mga magbabasa. Dugang pa, sa kaso sa direkta nga operasyon sa magbabasa nga adunay format sa FB, ang tiggamit adunay higayon nga ipasadya ang hapit tanan nga mga parameter sa pagpakita.

Ang estrikto nga istruktura sa dokumento nagtugot kanimo sa pag-automate sa proseso sa pagkakabig gikan sa FB format ngadto sa bisan unsa nga lain. Ang sama nga gambalay nagpaposible sa pagtrabaho uban sa tagsa-tagsa nga mga elemento sa mga dokumento - gibutang sa pagsala sa mga tagsulat sa libro, titulo, genre, ug uban pa Tungod niini nga rason, ang FB2 format nakaangkon pagkapopular sa Runet, nahimong default nga sumbanan sa Russian nga electronic librarya ug mga librarya. sa mga nasud sa CIS.

Mga disbentaha sa pormat

Ang kayano sa FB2 format mao ang iyang bentaha ug disbentaha sa samang higayon. Gilimitahan niini ang gamit alang sa komplikado nga layout sa teksto (pananglitan, mga nota sa mga margin). Wala kiniy vector graphics o suporta para sa mga ginumero nga listahan. Tungod niini nga hinungdan ang format dili kaayo angay alang sa mga libro, pakisayran nga mga libro ug teknikal nga literatura (ang ngalan sa format bisan pa sa pagsulti mahitungod niini - fiction libro, o "fiction libro").

Sa parehas nga oras, aron ipakita ang gamay nga kasayuran bahin sa libro - titulo, tagsulat ug hapin - kinahanglan nga iproseso sa programa ang hapit tanan nga dokumento sa XML. Kini tungod kay ang metadata moabut sa sinugdanan sa teksto ug ang mga imahe moabut sa katapusan.

FB3 - pagpalambo sa format

Tungod sa dugang nga mga kinahanglanon alang sa pag-format sa mga teksto sa libro (ug aron makunhuran ang pipila ka mga kakulangan sa FB2), si Gribov nagsugod sa pagtrabaho sa FB3 format. Ang pag-uswag sa ulahi mihunong, apan sa 2014 kini gipadayon.

Sumala sa mga tagsulat, gitun-an nila ang tinuod nga mga panginahanglan sa dihang nagmantala sa teknikal nga literatura, nagtan-aw sa mga libro, mga libro sa pakisayran, mga manwal ug naglatid sa usa ka mas espesipikong hugpong sa mga tag nga magtugot sa bisan unsang libro nga ipakita.

Sa bag-ong detalye, ang format sa FictionBook usa ka zip archive diin ang metadata, mga imahe ug teksto gitipigan isip bulag nga mga file. Ang mga kinahanglanon alang sa format sa zip file ug mga kombensiyon alang sa organisasyon niini gipiho sa sumbanan ECMA-376, nga naghubit sa Open XML.

Daghang mga pag-ayo ang gihimo nga may kalabotan sa pag-format (spacing, underlining) ug usa ka bag-ong butang ang gidugang - usa ka "block" - nga nag-format sa usa ka arbitraryong tipik sa usa ka libro sa porma sa usa ka quadrangle ug mahimong i-embed sa teksto nga adunay usa ka wraparound. Adunay na karon nga suporta alang sa ginumero ug gibullet nga mga lista.

Ang FB3 giapod-apod ubos sa usa ka libre nga lisensya ug bukas nga tinubdan, mao nga ang tanan nga mga utilities anaa sa mga magmamantala ug tiggamit: mga converter, mga editor sa panganod, mga magbabasa. kasamtangan bersyon format, magbabasa ΠΈ ang editor makita sa GitHub repository sa proyekto.

Sa kinatibuk-an, ang FictionBook3 dili kaayo kaylap kaysa sa iyang magulang nga lalaki, apan daghang mga elektronik nga librarya ang nagtanyag mga libro sa kini nga format. Ug ang mga litro duha ka tuig ang milabay nagpahibalo sa ilang katuyoan nga ibalhin ang ilang tibuuk nga katalogo sa usa ka bag-ong format. Gisuportahan na sa ubang mga magbabasa ang tanan nga kinahanglan nga gamit sa FB3. Pananglitan, ang tanan nga mga modernong modelo sa mga magbabasa sa ONYX mahimo nga magamit sa kini nga format sa gawas sa kahon, pananglitan, Darwin 3 o Cleopatra 3.

E-libro ug ang ilang mga format: FB2 ug FB3 - kasaysayan, pro, kontra ug prinsipyo sa trabaho
/ ONYX BOOX Cleopatra 3

Ang mas lapad nga pag-apod-apod sa FictionBook3 maghimo usa ka ekosistema oriented sa bug-os ug epektibo nga pagtrabaho uban sa teksto sa bisan unsa nga device uban sa limitado nga mga kapanguhaan: itom-ug-puti o gamay nga display, ubos nga memorya, ug uban pa.

PS Gidala namo sa imong pagtagad ang pipila ka mga pagsusi sa mga magbabasa sa ONYX BOOX:



Source: www.habr.com

Idugang sa usa ka comment