E-leabhraichean agus na cruthan aca: FB2 agus FB3 - eachdraidh, buannachdan, eas-bhuannachdan agus prionnsapalan obrach

Anns an artaigil roimhe bhruidhinn sinn mu dheidhinn Feartan an cruth DjVu. An-diugh chuir sinn romhainn fòcas a chuir air cruth FictionBook2, ris an canar nas fheàrr FB2, agus an “neach-leantainn” FB3.

E-leabhraichean agus na cruthan aca: FB2 agus FB3 - eachdraidh, buannachdan, eas-bhuannachdan agus prionnsapalan obrach
/flickr/ Judit Klein / CC

Tha coltas an cruth

Ann am meadhan nan 90an, luchd-dealasach tòiseachadh leabhraichean Sòbhieteach a dhèanamh digiteach. Dh'eadar-theangaich iad agus ghlèidh iad litreachas ann an caochladh chruthan. Aon de na ciad leabharlannan ann an Runet - Leabharlann Maxim Moshkov saor an asgaidh - chleachd e faidhle teacsa cruth (TXT).

Chaidh an roghainn a dhèanamh na fhàbhar leis gu robh e an aghaidh coirbeachd byte agus sùbailteachd - bidh TXT a’ fosgladh air siostam obrachaidh sam bith. Ge-tà, tha e rinn e duilich e làimhseachadh fiosrachadh teacsa a tha air a stòradh. Mar eisimpleir, gus gluasad chun mhìleamh loidhne, dh'fheumadh loidhnichean 999 roimhe a bhith air an giullachd. Leabhraichean cuideachd air a stòradh ann an sgrìobhainnean Word agus PDF - bha an tè mu dheireadh duilich a thionndadh gu cruthan eile, agus dh’ fhosgail coimpiutairean lag agus air a thaisbeanadh Sgrìobhainnean PDF le dàil.

Chaidh HTML a chleachdadh cuideachd airson litreachas dealanach a “stòradh”. Rinn e clàr-amais, atharrachadh gu cruthan eile, agus cruthachadh sgrìobhainnean (tagadh teacsa) na b’ fhasa, ach thug e a-steach na h-uireasbhaidhean aige fhèin. B’ e aon den fheadhainn as cudromaiche “neo-shoilleireachd» àbhaisteach: thug e saorsa sònraichte nuair a bha thu a’ sgrìobhadh tagaichean. Dh'fheumadh cuid dhiubh a bhith dùinte, cuid eile (mar eisimpleir, ) — cha robh feum air a dhùnadh. Dh’ fhaodadh òrdugh neadachaidh neo-riaghailteach a bhith aig na tagaichean fhèin.

Agus ged nach deach an leithid de dh’ obair le faidhlichean a bhrosnachadh - bhathas den bheachd gu robh na sgrìobhainnean sin ceàrr - bha an ìre ag iarraidh air luchd-leughaidh feuchainn ris an t-susbaint a thaisbeanadh. Seo far an do dh'èirich duilgheadasan, oir anns gach tagradh chaidh am pròiseas "tomhas" a chuir an gnìomh na dhòigh fhèin. Aig an aon àm, tha na h-innealan leughaidh agus na h-aplacaidean a tha rim faighinn air a 'mhargaid aig an àm sin tuigsinn cruth sònraichte no dhà. Nam biodh leabhar ri fhaighinn ann an aon chruth, dh'fheumadh e ath-leasachadh airson a bhith air a leughadh. Bhathar an dùil na h-easbhaidhean sin uile fhuasgladh Leabhar ficsean 2 a-nuas, no FB2, a ghabh thairis a’ chiad “cìreadh” den teacsa agus an tionndadh.

Thoir an aire gun robh a’ chiad dreach aig a’ chruth - Leabhar ficsean 1 a-nuas - ge-tà, cha robh ann ach deuchainneach ann an nàdar, cha do mhair e fada, chan eil taic ann an-dràsta agus chan eil e co-chòrdail air ais. Mar sin, mar as trice bidh FictionBook a’ ciallachadh an “neach-leantainn” aige - cruth FB2.

Chaidh FB2 a chruthachadh le buidheann de luchd-leasachaidh air an stiùireadh le Dmitry Gribov, a tha na stiùiriche teignigeach air a’ chompanaidh liotairean, agus Mikhail Matsnev, neach-cruthachaidh an Leughadair Haali. Tha an cruth stèidhichte air XML, a bhios a’ riaghladh obair le tagaichean gun dhùnadh agus neadachadh nas cruaidhe na HTML. An cois sgrìobhainn XML tha sgeama ris an canar XML. Is e faidhle sònraichte a th’ ann an sgeama XML anns a bheil na tagaichean gu lèir agus a bheir cunntas air na riaghailtean airson an cleachdadh (sreath, neadachadh, èigneachail agus roghainneil, msaa). Ann am FictionBook, tha an diagram anns an fhaidhle FictionBook2.xsd. Gheibhear eisimpleir sgeama XML aig cheangal (tha e air a chleachdadh leis a’ bhùth e-leabhar liotairean).

Structar na sgrìobhainn FB2

Teacs ann an sgrìobhainn air a stòradh ann an tagaichean sònraichte - eileamaidean de sheòrsan paragraf: , Agus . Tha eileamaid ann cuideachd , aig nach eil susbaint agus air a chleachdadh gus beàrnan a chuir a-steach.

Bidh a h-uile sgrìobhainn a’ tòiseachadh le taga freumh , gu h-ìosal a dh’ fhaodadh nochdadh , , Agus .

Tag tha duilleagan stoidhle ann gus tionndadh gu cruthan eile a dhèanamh comasach. ANNS breug air a chòdachadh a’ cleachdadh base64 dàta a dh’ fhaodadh a bhith a dhìth gus an sgrìobhainn a thoirt seachad.

Eileamaid tha a h-uile fiosrachadh riatanach mun leabhar: gnè na h-obrach, liosta ùghdaran (làn ainm, seòladh puist-d agus làrach-lìn), tiotal, bloc le prìomh fhaclan, notaichean. Faodaidh cuideachd fiosrachadh a bhith ann mu atharrachaidhean a chaidh a dhèanamh air an sgrìobhainn agus fiosrachadh mu fhoillsichear an leabhair ma chaidh fhoillseachadh air pàipear.

Seo cò ris a tha pàirt den bhloc coltach ann an inntrigeadh FictionBook airson obraichean "A Study in Scarlet" le Artair Conan Doyle, air a thoirt bho Pròiseact Gutenberg saor an asgaidh:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Is e am prìomh phàirt de sgrìobhainn FictionBook . Tha teacsa an leabhair fhèin ann. Faodaidh grunn de na tagaichean sin a bhith air feadh na sgrìobhainn - bidh blocaichean a bharrachd gan cleachdadh gus notaichean-coise, beachdan agus notaichean a stòradh.

Bidh FictionBook cuideachd a’ toirt seachad grunn tagaichean airson a bhith ag obair le hyperlinks. Tha iad stèidhichte air an t-sònrachadh XCeangal, air a leasachadh leis a’ cho-bhanntachd W3C gu sònraichte airson ceanglaichean a chruthachadh eadar diofar ghoireasan ann an sgrìobhainnean XML.

Buannachdan an cruth

Tha an inbhe FB2 a’ toirt a-steach dìreach an t-seata tagaichean as ìsle a tha riatanach (gu leòr airson ficsean “dealbhadh”), a bhios a’ sìmpleachadh a ghiullachd le luchd-leughaidh. A bharrachd air an sin, a thaobh obrachadh dìreach an leughadair leis an cruth FB, tha cothrom aig an neach-cleachdaidh cha mhòr a h-uile paramadair taisbeanaidh a ghnàthachadh.

Leigidh structar teann na sgrìobhainn leat am pròiseas tionndaidh bho chruth FB gu cruth sam bith eile gu fèin-ghluasadach. Tha an aon structar ga dhèanamh comasach a bhith ag obair le eileamaidean fa leth de sgrìobhainnean - a stèidheachadh sìoltachain le ùghdaran leabhraichean, tiotal, gnè, etc. ann an dùthchannan CIS.

Eas-bhuannachdan an cruth

Tha sìmplidheachd cruth FB2 na bhuannachd agus ana-cothrom aig an aon àm. Tha seo a’ cuingealachadh comasachd cruth teacsa iom-fhillte (mar eisimpleir, notaichean air na h-iomaill). Chan eil grafaigean feòir ann no taic airson liostaichean àireamhaichte. Airson an adhbhar seo an cruth chan eil e gu math freagarrach airson leabhraichean teacsa, leabhraichean fiosrachaidh agus litreachas teicnigeach (tha ainm an cruth eadhon a’ bruidhinn mu dheidhinn seo - leabhar ficsean, no “leabhar ficsean”).

Aig an aon àm, gus glè bheag de dh'fhiosrachadh mun leabhar a thaisbeanadh - tiotal, ùghdar agus còmhdach - feumaidh am prògram cha mhòr an sgrìobhainn XML gu lèir a phròiseasadh. Tha seo air sgàth gu bheil meata-dàta a’ tighinn aig toiseach an teacsa agus tha ìomhaighean a’ tighinn aig an deireadh.

FB3 leasachadh cruth

Mar thoradh air barrachd riatanasan airson cruth teacsaichean leabhraichean (agus gus cuid de na h-easbhaidhean ann an FB2 a lasachadh), thòisich Gribov ag obair air cruth FB3. Sguir an leasachadh nas fhaide air adhart, ach ann an 2014 bha e ath-thòisich.

A rèir nan ùghdaran, rinn iad sgrùdadh air na fìor fheumalachdan nuair a bha iad a’ foillseachadh litreachas teignigeach, choimhead iad air leabhraichean teacsa, leabhraichean fiosrachaidh, leabhraichean-làimhe agus mhìnich iad seata tagaichean nas sònraichte a leigeadh le leabhar sam bith a thaisbeanadh.

Anns an t-sònrachadh ùr, tha an cruth FictionBook na thasglann zip anns a bheil meata-dàta, ìomhaighean agus teacsa air an stòradh mar fhaidhlichean air leth. Tha riatanasan airson cruth faidhle zip agus gnàthasan airson a bhuidheann air an sònrachadh san inbhe ECMA-376, a tha a’ mìneachadh Open XML.

Chaidh grunn leasachaidhean a dhèanamh co-cheangailte ri fòrmatadh (farsaingeachd, fo-loidhne) agus chaidh rud ùr a chur ris - “bloc” - a bhios a’ cruth criomag neo-riaghailteach de leabhar ann an cruth ceithir-cheàrnach agus a ghabhas fhighe a-steach ann an teacsa le còmhdach-còmhdaich. Tha taic ann a-nis airson liostaichean le àireamh agus peilearan.

Tha FB3 air a chuairteachadh fo chead an-asgaidh agus tha e fosgailte, agus mar sin tha a h-uile goireas ri fhaighinn le foillsichearan agus luchd-cleachdaidh: luchd-tionndaidh, luchd-deasachaidh sgòthan, luchd-leughaidh. Gnàthach dreach cruth, leughadair и an neach-deasachaidh ri lorg ann an stòr GitHub a’ phròiseict.

San fharsaingeachd, chan eil FictionBook3 fhathast cho farsaing ri a bhràthair as sine, ach tha grunn leabharlannan dealanach a’ tabhann leabhraichean sa chruth seo mu thràth. Agus dh’ainmich liotairean o chionn bliadhna no dhà gu robh iad an dùil an catalog slàn aca a ghluasad gu cruth ùr. Tha cuid de luchd-leughaidh mu thràth a’ toirt taic do gach gnìomh FB3 a tha riatanach. Mar eisimpleir, faodaidh a h-uile modal ùr-nodha de leughadairean ONYX obrachadh leis a ’chruth seo a-mach às a’ bhogsa, mar eisimpleir, Darwin 3 no Cleopatra 3.

E-leabhraichean agus na cruthan aca: FB2 agus FB3 - eachdraidh, buannachdan, eas-bhuannachdan agus prionnsapalan obrach
/ ONYX BOOX Cleopatra 3

Cruthaichidh cuairteachadh nas fharsainge de FictionBook3 eag-shiostam stiuradh obrachadh gu h-iomlan agus gu h-èifeachdach le teacsa air inneal sam bith le goireasan cuibhrichte: dubh-is-geal no taisbeanadh beag, cuimhne ìosal, msaa.

PS Bheir sinn gu d’ aire grunn lèirmheasan air leughadairean ONYX BOOX:



Source: www.habr.com

Cuir beachd ann