E-buugaagta iyo qaababkooda: FB2 iyo FB3 - taariikhda, faa'iidooyinka, khasaaraha iyo mabaadi'da hawlgalka

Maqaalkii hore waxaan kaga hadalnay sifooyinka qaabka DjVu. Maanta waxaan go'aansanay in aan diirada saarno qaabka FictionBook2, oo loo yaqaan FB2, iyo "ku-beddelka" FB3.

E-buugaagta iyo qaababkooda: FB2 iyo FB3 - taariikhda, faa'iidooyinka, khasaaraha iyo mabaadi'da hawlgalka
/flickr/ Judit Klein / CC

Muuqaalka qaabka

Bartamihii 90aadkii, xamaasad bilaabay digitize buugaagta Soofiyeedka. Waxay u turjumeen oo xafideen suugaanta qaabab kala duwan oo kala duwan. Mid ka mid ah maktabadaha ugu horreeya ee Runet - Maktabadda Maxim Moshkov - loo adeegsaday faylka qoraalka qaabaysan (TXT).

Doorashada ayaa loo sameeyay iyada oo ay ugu wacan tahay iska caabinteeda musuqmaasuqa byte-ka iyo kala-duwanaanta - TXT wuxuu ka furmayaa nidaam kasta oo hawlgal ah. Si kastaba ha ahaatee, isagu ka dhigay mid adag habaynta macluumaadka qoraalka kaydsan. Tusaale ahaan, si aad ugu gudubto xariiqda kun-naad, 999 sadar oo ka horreeyay waxay ahayd in la farsameeyo. Buugaag sidoo kale kaydsan dukumentiyada Word iyo PDF - kan dambe way adkeyd in loo beddelo qaabab kale, kombiyuutarrada daciifka ahna waa la furay iyo soo bandhigay Dukumeenti PDF leh dib u dhac

HTML waxa kale oo loo isticmaalay in lagu "kaydiyo" suugaanta elegtarooniga ah. Waxa ay fududaysay tusmaynta, u beddelashada qaabab kale, iyo abuurista dukumeenti (tagging text), laakiin waxa ay soo bandhigtay cilladaheeda. Mid ka mid ah kuwa ugu muhiimsan waxay ahayd "aan caddaynΒ» halbeeg: waxay ogolaatay xoriyado gaar ah marka la qorayo tags. Qaar ka mid ah waxay ahayd in la xiro, kuwa kale (tusaale ahaan, ) - looma baahnayn in la xiro. Calaamadaha laftoodu waxay yeelan karaan amar buul oo aan sabab lahayn.

In kasta oo shaqada noocan oo kale ah ee faylasha aan lagu dhiirigelin - dukumeentiyada noocan oo kale ah ayaa loo tixgeliyey inay khaldan yihiin - akhristayaasha caadiga ah ee loo baahan yahay inay isku dayaan inay muujiyaan nuxurka. Tani waa meesha ay dhibaatooyin ka soo baxeen, maadaama codsi kasta habka "male-awaalka" loo fuliyay sidiisa. Isla markaana, agabka wax-akhriska iyo codsiyada laga heli karo suuqa wakhtigaas fahmay hal ama laba qaab oo gaar ah. Haddii buug loo heli karo hal qaab, waxay ahayd in dib loo habeeyo si loo akhriyo. Waxaa loogu talagalay in lagu xalliyo dhammaan cilladahaas Buuga khiyaaliga2, ama FB2, kaas oo la wareegay bilowga "shanlayda" qoraalka iyo beddelka.

Ogow in qaabku lahaa nuqulkiisii ​​ugu horreeyay - Buuga khiyaaliga1 - si kastaba ha ahaatee, waxay ahayd tijaabo dabiici ah oo keliya, ma sii socon, hadda lama taageero, mana aha dib-u-dhac ku habboon. Sidaa darteed, Buuga Fictionbook wuxuu inta badan ka dhigan yahay β€œku-beddelkiisa” - qaabka FB2.

FB2 waxaa sameeyay koox horumariyayaal ah oo ay hogaaminayaan Dmitry Gribov, oo ah maamulaha farsamada ee shirkadda litirka, iyo Mikhail Matsnev, oo ah abuuraha Haali Reader. Qaabku waxa uu ku salaysan yahay XML, kaas oo habeeya shaqada leh calaamado aan la xidhin oo buul leh oo ka adag HTML. Dukumeentiga XML waxa la socda waxa loo yaqaan XML Schema. Qorshaha XML waa fayl gaar ah oo ka kooban dhammaan sumadaha oo qeexaya xeerarka isticmaalkooda (isku xigxiga, buulka, qasabka iyo ikhtiyaariga ah, iwm.). Buuga Fictionbook, jaantusku waxa uu ku yaalaa faylka FictionBook2.xsd. Tusaale XML schema waxaa laga heli karaa at link (waxaa isticmaala dukaanka e-book-ga ee litir).

Qaab dhismeedka dukumeentiga FB2

Qoraal dukumeenti ah waa la keydiyaa in tags gaar ah - walxaha noocyada cutubka: , Iyo . Waxa kale oo jira curiye , kaas oo aan lahayn wax nuxur ah oo loo isticmaalo in la geliyo daldaloolo.

Dhammaan dukumeentiyadu waxay ku bilowdaan summada xididka , hoos kaas oo ka muuqan kara , , Iyo .

Tag ka kooban xaashi qaab ah si loo fududeeyo beddelka qaabab kale. IN been kood la geliyo saldhig 64 xogta laga yaabo in loo baahdo si loo keeno dukumeentiga.

Curiyaha waxaa ku jira dhammaan macluumaadka lagama maarmaanka ah ee buugga: nooca shaqada, liiska qorayaasha (magaca buuxa, cinwaanka iimaylka iyo bogga internetka), cinwaanka, xannibaadaha ereyada muhiimka ah, sharraxaadda. Waxa kale oo laga yaabaa inay ku jirto macluumaadka ku saabsan isbeddelada lagu sameeyay dukumeentiga iyo macluumaadka ku saabsan daabacaha buugga haddii lagu daabacay warqad.

Tani waa waxa ay u egtahay qayb ka mid ah xannibaadda Buuga Fictionbook gelida ee shaqeeya "Study in Scarlet" ee Arthur Conan Doyle, laga soo qaatay Mashruuca Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Qaybta muhiimka ah ee dukumeentiga buug-yaraha waa . Waxa ku jira qoraalka buugga laftiisa. Waxa jiri kara dhawr ka mid ah summadan dukumeentiga oo dhan - baloogyo dheeraad ah ayaa loo isticmaalaa in lagu kaydiyo qoraallada hoose, faallooyinka iyo qoraallada.

Buuga fiction-ka waxa kale oo uu bixiyaa dhowr tags oo lagula shaqeeyo hyperlinks. Waxay ku saleysan yihiin qeexitaanka XLink, oo ay soo saartay dalada W3C gaar ahaan abuurista isku xidhka u dhexeeya ilaha kala duwan ee dukumentiyada XML.

Faa'iidooyinka qaabka

Heerarka FB2 waxaa ku jira oo kaliya tirada ugu yar ee loo baahan yahay ee summada (ku filan "naqshadeynta" khayaaliga), kaas oo fududeynaya hab-raaciisa akhristayaasha. Waxaa intaa dheer, marka la eego hawlgalka tooska ah ee akhristaha oo leh qaabka FB, isticmaaluhu wuxuu leeyahay fursad uu ku habeeyo ku dhawaad ​​​​dhammaan xuduudaha bandhigga.

Qaab dhismeedka adag ee dukumeentigu wuxuu kuu ogolaanayaa inaad si otomaatig ah uga dhigto habka beddelka qaabka FB mid kasta oo kale. Qaab dhismeedka isku mid ah ayaa suurtogal ka dhigaya in la shaqeeyo walxaha shakhsi ahaaneed ee dukumiintiyada - samee filtarrada qorayaasha buugaagta, cinwaanka, nooca, iwm. Sababtan awgeed, qaabka FB2 ayaa caan ku ah Runet, isagoo noqday heerka caadiga ah ee maktabadaha elektiroonigga ah ee Ruushka iyo maktabadaha. ee wadamada CIS.

Khasaaraha qaabka

Fududeynta qaabka FB2 waa faa'iido iyo khasaare isku mar. Tani waxay xaddidaysaa shaqaynta qaabaynta qoraalka kakan (tusaale, qoraallada ku yaal marginsyada). Ma laha garaafyo vector ama taageero liisaska lambaraysan. Sababtan awgeed qaabka aan aad ugu habboonayn buugaagta akhriska, buugaagta tixraaca iyo suugaanta farsamada (magaca qaabka xitaa waxa uu ka hadlayaa tan - buug khayaali ah, ama "buug khayaali ah").

Isla mar ahaantaana, si loo muujiyo macluumaadka ugu yar ee ku saabsan buugga - cinwaanka, qoraaga iyo jaldiga - barnaamijku wuxuu u baahan yahay inuu socodsiiyo dhammaan dukumeenti XML ah. Tani waa sababta oo ah xogta badan waxay timaadaa bilowga qoraalka iyo sawiradu waxay yimaadaan dhamaadka.

FB3 - horumarinta qaabka

Sababo la xiriira shuruudaha kor u kaca ee qaabeynta qoraallada buugaagta (iyo si loo yareeyo qaar ka mid ah cilladaha FB2), Gribov wuxuu bilaabay inuu ka shaqeeyo qaabka FB3. Horumarka markii dambe wuu istaagay, laakiin 2014-kii waxay ahayd dib loo bilaabay.

Sida laga soo xigtay qorayaashu, waxay daraasad ku sameeyeen baahiyaha dhabta ah marka ay daabacaan suugaanta farsamada, waxay eegeen buugaagta wax lagu barto, buugaagta tixraaca, buug-gacmeedyada waxayna qeexeen calaamado gaar ah oo u oggolaanaya in buug kasta la soo bandhigo.

Faahfaahinta cusub, qaabka Buuga Fiction waa kaydka zip kaas oo xogta badan, sawirada iyo qoraalka lagu kaydiyo sidii faylal gaar ah. Shuruudaha qaabka faylka zip-ka iyo heshiisyada ururkeeda ayaa lagu qeexay heerka ECMA-376, kaas oo qeexaya Fur XML.

Dhowr horumar ayaa la sameeyay oo la xiriira qaabeynta (meel bannaan, hoosta ka xarriiqda) iyo shay cusub ayaa lagu daray - "block" - kaas oo qaabeeya jajab aan sabab lahayn oo buug ah oo qaab afar geesle ah oo lagu dhejin karo qoraal leh duub. Hadda waxaa jira taageero loogu talagalay liisaska nambarada iyo kuwa rasaasta leh.

FB3 waxaa lagu qaybiyaa shatiga bilaashka ah waana il furan, sidaa darteed dhammaan agabka ayaa diyaar u ah daabacayaasha iyo isticmaalayaasha: beddelayaasha, tifaftirayaasha daruuraha, akhristayaasha. Hadda nooca qaab, akhriste ΠΈ tifaftiraha waxaa laga heli karaa goobta GitHub ee mashruuca.

Guud ahaan, FictionBook3 weli wuu ka sii fidsan yahay walaalkii ka weyn, laakiin dhowr maktabadood oo elektaroonig ah ayaa horey u soo bandhigay buugaag qaabkan ah. Litir laba sano ka hor ayaa ku dhawaaqay rabitaankooda ah inay ku wareejiyaan buuggooda oo dhan qaab cusub. Qaar ka mid ah akhristayaasha ayaa horeba u taageeray dhammaan hawlaha FB3 lagama maarmaanka u ah. Tusaale ahaan, dhammaan moodooyinka casriga ah ee akhristayaasha ONYX waxay la shaqayn karaan qaabkan meel ka baxsan sanduuqa, tusaale ahaan, Darwin 3 ama Cleopatra 3.

E-buugaagta iyo qaababkooda: FB2 iyo FB3 - taariikhda, faa'iidooyinka, khasaaraha iyo mabaadi'da hawlgalka
/ ONYX BOOX Cleopatra 3

Qaybinta ballaaran ee FictionBook3 waxay abuuri doontaa nidaamka deegaanka jihaysan si buuxda oo wax ku ool ah ugu shaqeeyaan qoraalka qalab kasta oo leh kheyraad xaddidan: madow iyo caddaan ama muuqaal yar, xusuusta hoose, iwm.

PS Waxaan kuu soo jeedinaynaa dhowr faallood oo ku saabsan akhristayaasha ONYX BOOX:



Source: www.habr.com

Add a comment