ProHoster > Blogs > interneta ziÅas > E-grÄmatas un to formÄti: FB2 un FB3 - vÄsture, plusi, mÄ«nusi un darbÄ«bas principi
E-grÄmatas un to formÄti: FB2 un FB3 - vÄsture, plusi, mÄ«nusi un darbÄ«bas principi
IepriekÅ”ÄjÄ rakstÄ mÄs runÄjÄm par DjVu formÄta funkcijas. Å odien mÄs nolÄmÄm koncentrÄties uz FictionBook2 formÄtu, kas labÄk pazÄ«stams kÄ FB2, un tÄ "pÄcteci" FB3.
90. gadu vidÅ« entuziasti MÄs sÄkÄm digitalizÄt padomju grÄmatas. ViÅi tulkoja un saglabÄja literatÅ«ru visdažÄdÄkajos formÄtos. Viena no pirmajÄm Runet bibliotÄkÄm - Maksima MoÅ”kova bibliotÄka - izmantots formatÄts teksta fails (TXT).
IzvÄle tika izdarÄ«ta par labu tÄ izturÄ«bas pret baitu bojÄjumiem un daudzpusÄ«bas dÄļ - TXT tiek atvÄrts jebkurÄ operÄtÄjsistÄmÄ. TomÄr viÅÅ” apgrÅ«tinÄja saglabÄtÄs teksta informÄcijas apstrÄde. PiemÄram, lai pÄrietu uz tÅ«kstoÅ”o rindiÅu, bija jÄapstrÄdÄ 999 rindas pirms tÄs. GrÄmatas arÄ« glabÄjas Word dokumentos un PDF - pÄdÄjo bija grÅ«ti pÄrvÄrst citos formÄtos, un vÄji datori tika atvÄrti un parÄdÄ«ts PDF dokumenti ar kavÄÅ”anos.
HTML tika izmantots arÄ« elektroniskÄs literatÅ«ras āglabÄÅ”anaiā. Tas atviegloja indeksÄÅ”anu, pÄrveidoÅ”anu citos formÄtos un dokumentu izveidi (teksta marÄ·ÄÅ”anu), taÄu tas ieviesa savus trÅ«kumus. Viens no nozÄ«mÄ«gÄkajiem bija "neskaidrÄ«baĀ» standarts: tas atļÄva noteiktas brÄ«vÄ«bas, rakstot tagus. Dažas no tÄm bija jÄslÄdz, citas (piemÄram, ) - nebija vajadzÄ«bas to aizvÄrt. PaÅ”iem tagiem var bÅ«t patvaļīga ligzdoÅ”anas secÄ«ba.
Un, lai gan Å”Äds darbs ar failiem netika veicinÄts - Å”Ädi dokumenti tika uzskatÄ«ti par nepareiziem - standarts prasÄ«ja lasÄ«tÄjiem mÄÄ£inÄt parÄdÄ«t saturu. Å eit radÄs grÅ«tÄ«bas, jo katrÄ pieteikumÄ āminÄÅ”anasā process tika Ä«stenots savÄ veidÄ. TajÄ paÅ”Ä laikÄ tajÄ laikÄ tirgÅ« pieejamÄs lasÄ«Å”anas ierÄ«ces un aplikÄcijas sapratu viens vai divi specializÄti formÄti. Ja grÄmata bija pieejama vienÄ formÄtÄ, tÄ bija jÄpÄrformatÄ, lai to varÄtu lasÄ«t. Tas bija paredzÄts, lai atrisinÄtu visus Å”os trÅ«kumus DaiļliteratÅ«ra2, vai FB2, kas pÄrÅÄma sÄkotnÄjo teksta āÄ·emmÄÅ”anuā un konvertÄÅ”anu.
Å emiet vÄrÄ, ka formÄtam bija pirmÄ versija - DaiļliteratÅ«ra1 - tomÄr tas bija tikai eksperimentÄls, tas nebija ilgi, paÅ”laik netiek atbalstÄ«ts un nav saderÄ«gs ar atpakaļejoÅ”u spÄku. TÄpÄc FictionBook visbiežÄk nozÄ«mÄ tÄ āpÄcteciā - FB2 formÄtu.
FB2 izveidoja izstrÄdÄtÄju grupa, kuru vadÄ«ja Dmitrijs Gribovs, kurÅ” ir litru uzÅÄmuma tehniskais direktors, un Mihails MatsÅevs, Haali Reader radÄ«tÄjs. FormÄts ir balstÄ«ts uz XML, kas regulÄ darbu ar neaizvÄrtiem un ligzdotiem tagiem stingrÄk nekÄ HTML. XML dokumentam ir pievienota tÄ sauktÄ XML shÄma. XML shÄma ir Ä«paÅ”s fails, kas satur visus tagus un apraksta to lietoÅ”anas noteikumus (secÄ«ba, ligzdoÅ”ana, obligÄta un neobligÄta utt.). ProgrammÄ FictionBook diagramma atrodas failÄ FictionBook2.xsd. XML shÄmas piemÄru var atrast vietnÄ saite (to izmanto litru e-grÄmatu veikals).
FB2 dokumentu struktūra
Teksts dokumentÄ tur Ä«paÅ”os tagos - rindkopu veidu elementi: , Un . Ir arÄ« elements , kam nav satura un tiek izmantots atstarpju ievietoÅ”anai.
Visi dokumenti sÄkas ar saknes tagu , zem kura var parÄdÄ«ties , , Un .
Tag satur stila lapas, lai atvieglotu pÄrveidoÅ”anu citos formÄtos. IN meli kodÄti izmantojot base64 dati, kas var bÅ«t nepiecieÅ”ami dokumenta atveidoÅ”anai.
Elements satur visu nepiecieÅ”amo informÄciju par grÄmatu: darba žanrs, autoru saraksts (pilns vÄrds, e-pasta adrese un vietne), nosaukums, bloks ar atslÄgvÄrdiem, anotÄcija. TajÄ var bÅ«t arÄ« informÄcija par dokumentÄ veiktajÄm izmaiÅÄm un informÄcija par grÄmatas izdevÄju, ja tÄ izdota papÄ«ra formÄtÄ.
Å Ädi izskatÄs bloka daļa FictionBook ierakstÄ par darbojas ArtÅ«ra Konana Doila "PÄtÄ«jums koÅ”i krÄsÄ", Åemts no Projekts GÅ«tenbergs:
FictionBook dokumenta galvenÄ sastÄvdaļa ir . TajÄ ir paÅ”as grÄmatas teksts. VisÄ dokumentÄ var bÅ«t vairÄki no Å”iem tagiem ā papildu bloki tiek izmantoti zemsvÄ«tras piezÄ«mju, komentÄru un piezÄ«mju glabÄÅ”anai.
FictionBook nodroÅ”ina arÄ« vairÄkus tagus darbam ar hipersaitÄm. Tie ir balstÄ«ti uz specifikÄciju XLink, ko izstrÄdÄjis konsorcijs W3C Ä«paÅ”i, lai izveidotu saites starp dažÄdiem resursiem XML dokumentos.
FormÄta priekÅ”rocÄ«bas
FB2 standartÄ ir iekļauts tikai minimÄlais nepiecieÅ”amais tagu komplekts (pietiekami, lai ānoformÄtuā daiļliteratÅ«ru), kas atvieglo tÄ apstrÄdi lasÄ«tÄjiem. TurklÄt, ja lasÄ«tÄjs darbojas tieÅ”i ar FB formÄtu, lietotÄjam ir iespÄja pielÄgot gandrÄ«z visus displeja parametrus.
StingrÄ dokumenta struktÅ«ra ļauj automatizÄt konvertÄÅ”anas procesu no FB formÄta uz jebkuru citu. TÄda pati struktÅ«ra ļauj strÄdÄt ar atseviŔķiem dokumentu elementiem - iestatÄ«t filtrus pÄc grÄmatu autoriem, nosaukuma, žanra utt. Å Ä« iemesla dÄļ FB2 formÄts ir ieguvis popularitÄti Runet, kļūstot par noklusÄjuma standartu Krievijas elektroniskajÄs bibliotÄkÄs un bibliotÄkÄs. NVS valstÄ«s.
FormÄta trÅ«kumi
FB2 formÄta vienkÄrŔība ir tÄ priekÅ”rocÄ«ba un trÅ«kums vienlaikus. Tas ierobežo funkcionalitÄti sarežģītam teksta izkÄrtojumam (piemÄram, piezÄ«mÄm uz piemalÄm). Tam nav vektorgrafikas vai numurÄtu sarakstu atbalsta. Å Ä« iemesla dÄļ formÄts nav Ä«paÅ”i piemÄrots mÄcÄ«bu grÄmatÄm, uzziÅu grÄmatÄm un tehniskajai literatÅ«rai (formÄta nosaukums pat runÄ par Å”o - daiļliteratÅ«ras grÄmata vai ādaiļliteratÅ«ras grÄmataā).
TajÄ paÅ”Ä laikÄ, lai parÄdÄ«tu minimÄlu informÄciju par grÄmatu - nosaukumu, autoru un vÄku, programmai ir jÄapstrÄdÄ gandrÄ«z viss XML dokuments. Tas ir tÄpÄc, ka metadati parÄdÄs teksta sÄkumÄ, bet attÄli - beigÄs.
FB3 - formÄta izstrÄde
SakarÄ ar paaugstinÄtÄm prasÄ«bÄm grÄmatu tekstu formatÄÅ”anai (un lai mazinÄtu dažus FB2 trÅ«kumus), Gribov sÄka strÄdÄt pie FB3 formÄta. AttÄ«stÄ«ba vÄlÄk apstÄjÄs, bet 2014. gadÄ tÄ bija atsÄkta.
PÄc autoru domÄm, viÅi pÄtÄ«ja patiesÄs vajadzÄ«bas, izdodot tehnisko literatÅ«ru, apskatÄ«ja mÄcÄ«bu grÄmatas, uzziÅu grÄmatas, rokasgrÄmatas un iezÄ«mÄja konkrÄtÄku tagu komplektu, kas ļautu izlikt jebkuru grÄmatu.
JaunajÄ specifikÄcijÄ FictionBook formÄts ir zip arhÄ«vs, kurÄ metadati, attÄli un teksts tiek glabÄti kÄ atseviŔķi faili. PrasÄ«bas zip faila formÄtam un tÄ organizÄÅ”anas konvencijas ir noteiktas standartÄ ECMA-376, kas definÄ Open XML.
Tika veikti vairÄki uzlabojumi, kas saistÄ«ti ar formatÄÅ”anu (atstarpes, pasvÄ«trojumi), un tika pievienots jauns objekts - ābloksā, kas ÄetrstÅ«ra formÄ formatÄ patvaļīgu grÄmatas fragmentu un var tikt iegults tekstÄ ar iesaiÅojumu. Tagad ir pieejams numurÄtu un aizzÄ«mju sarakstu atbalsts.
FB3 tiek izplatÄ«ts saskaÅÄ ar bezmaksas licenci un ir atvÄrts avots, tÄpÄc izdevÄjiem un lietotÄjiem ir pieejamas visas utilÄ«tas: pÄrveidotÄji, mÄkoÅa redaktori, lasÄ«tÄji. PaÅ”reizÄjais versiju formÄts, lasÄ«tÄjs Šø redaktors var atrast projekta GitHub repozitorijÄ.
KopumÄ FictionBook3 joprojÄm ir mazÄk izplatÄ«ts nekÄ tÄ vecÄkais brÄlis, taÄu vairÄkas elektroniskÄs bibliotÄkas jau piedÄvÄ grÄmatas Å”ajÄ formÄtÄ. Un litri pirms pÄris gadiem paziÅoja par nodomu visu savu katalogu pÄrcelt uz jaunu formÄtu. Daži lasÄ«tÄji jau atbalsta visu nepiecieÅ”amo FB3 funkcionalitÄti. PiemÄram, visi mÅ«sdienu ONYX lasÄ«tÄju modeļi var strÄdÄt ar Å”o formÄtu jau no kastes, piemÄram, Darvins 3 vai Kleopatra 3.
PlaÅ”Äka FictionBook3 izplatÄ«Å”ana radÄ«s ekosistÄmu orientÄts pilnÄ«bÄ un efektÄ«vi strÄdÄt ar tekstu jebkurÄ ierÄ«cÄ ar ierobežotiem resursiem: melnbalts vai mazs displejs, maza atmiÅa utt. PÄc izstrÄdÄtÄju domÄm, grÄmata pÄc iespÄjas ÄrtÄka bÅ«s jebkurÄ vidÄ.