R-leabhair agus a bhformáidí: DjVu - a stair, buntáistí, míbhuntáistí agus gnéithe

Sna 70í luatha, bhainistigh an scríbhneoir Meiriceánach Michael Hart fháil rochtain neamhtheoranta ar ríomhaire Xerox Sigma 5 atá suiteáilte in Ollscoil Illinois. Chun úsáid mhaith a bhaint as acmhainní an mheaisín, chinn sé an chéad leabhar leictreonach a chruthú, ag athphriontáil Dearbhú Neamhspleáchais na SA.

Sa lá atá inniu ann, tá litríocht dhigiteach tar éis éirí go forleathan, go príomha a bhuíochas le forbairt gléasanna iniompartha (fóin chliste, r-léitheoirí, ríomhairí glúine). Mar thoradh air seo tháinig líon mór formáidí ríomhleabhar chun cinn. Déanaimis iarracht a gcuid gnéithe a thuiscint agus stair na cinn is coitianta acu a insint - déanaimis tosú leis an bhformáid DjVu.

R-leabhair agus a bhformáidí: DjVu - a stair, buntáistí, míbhuntáistí agus gnéithe
/flickr/ Pearman Lána / CC

Teacht chun cinn an fhormáid

D'fhorbair AT&T Labs DjVu i 1996 le cuspóir amháin - uirlis a thabhairt d'fhorbróirí gréasáin chun íomhánna ardtaifigh a dháileadh ar an Idirlíon.

Is é an bhfíric go bhfuil ag an am sin 90% den fhaisnéis go léir fós bhí stóráilte ar pháipéar, agus bhí íomhánna daite agus grianghraif i gcuid mhór de na doiciméid thábhachtacha. Chun inléiteacht an téacs agus cáilíocht na bpictiúr a choinneáil, b'éigean scananna ardtaifigh a dhéanamh.

Formáidí gréasáin clasaiceach - JPEG, GIF agus PNG - rinne sé indéanta a bheith ag obair le híomhánna den sórt sin, ach ar chostas toirt. I gcás JPEG, ionas go mbeidh an téacs léadh ar scáileán an mhonatóra, bhí orm an doiciméad a scanadh le taifeach 300 dpi. Bhí thart ar 500 KB ar leathanach datha na hirise. Ba phróiseas dian ar shaothar an tráth sin comhaid den mhéid seo a íoslódáil ón Idirlíon.

Ba é an rogha eile ná doiciméid pháipéir a dhigitiú ag baint úsáide as teicneolaíochtaí OCR, ach 20 bliain ó shin bhí a gcruinneas i bhfad ó idéalach - tar éis próiseála, b'éigean an toradh deiridh a chur in eagar go dáiríre de láimh. Ag an am céanna, d’fhan grafaicí agus íomhánna “thar bord”. Agus fiú dá bhféadfaí íomhá scanta a leabú i ndoiciméad téacs, cailleadh roinnt sonraí amhairc, mar shampla, dath an pháipéir, a uigeacht, agus is comhpháirteanna tábhachtacha iad seo de dhoiciméid stairiúla.

D'fhonn na fadhbanna seo a réiteach, d'fhorbair AT&T DjVu. Bhíothas in ann doiciméid datha scanta a chomhbhrú le taifeach 300 pso go 40–60 KB, le méid bunaidh 25 MB. Laghdaigh DjVu méid na leathanach dubh agus bán go 10–30 KB.

Conas a chomhbhrúigh djvu doiciméid

Is féidir le DjVu oibriú le doiciméid pháipéir scanta agus formáidí digiteacha eile, mar PDF. Conas a oibríonn djvu luíonn teicneolaíocht a scoilteann an íomhá i dtrí chomhpháirt: tulra, cúlra agus masc dubh agus bán (giotán).

Sábháiltear an masc ag taifeach an chomhaid bhunaidh agus íomhá an téacs agus sonraí soiléire eile - línte míne agus léaráidí - chomh maith le pictiúir codarsnachta.

Tá taifeach 300 dpi aige chun línte míne agus imlíne na litreach a choinneáil géar, agus déantar é a chomhbhrú ag baint úsáide as an algartam JB2, atá ina athrú ar algartam JBIG2 AT&T le haghaidh facsála. Gné de JB2 Is é is é an rud a dhéanann sé ná lorgaíonn sé carachtair dhúblacha ar an leathanach agus ní shábhálann sé a n-íomhá ach uair amháin. Mar sin, i ndoiciméid illeathanaigh, bíonn “foclóir” coiteann ag gach cúpla leathanach as a chéile.

Tá uigeacht an leathanaigh agus na léaráidí sa chúlra, agus tá a thaifeach níos ísle ná an masc. Sábháiltear an cúlra gan chailliúint ag 100 dpi.

Talamh Coinníonn faisnéis dath faoin masc, agus de ghnáth laghdaítear a réiteach níos faide, ós rud é i bhformhór na gcásanna go bhfuil dath an téacs dubh agus mar an gcéanna le haghaidh carachtar clóite amháin. Úsáidtear é chun an tulra agus an cúlra a chomhbhrú comhbhrú tonnchosc.

Is é an chéim dheireanach de chruthú doiciméad DjVu ná ionchódú eantrópachta, nuair a dhéanann ionchódóir uimhríochtúil oiriúnaitheach seichimh de charachtair comhionanna a thiontú ina luach dénártha.

Buntáistí an fhormáid

Ba é an tasc a bhí ag DjVu sábháil “airíonna” doiciméad páipéir i bhfoirm dhigiteach, rud a ligeann fiú do ríomhairí laga oibriú le doiciméid dá leithéid. Mar sin, tá an cumas ag bogearraí chun comhaid DjVu a fheiceáil “rindreáil tapa”. Buíochas léi i gcuimhne luchtú ní gá ach an píosa sin den leathanach DjVu a thaispeáint ar an scáileán.

Fágann sé seo gur féidir comhaid “neamhíoslódála” a fheiceáil, is é sin, leathanaigh aonair de dhoiciméad il-leathanach DjVu. Sa chás seo, baintear úsáid as líníocht fhorásach ar shonraí íomhá, nuair is cosúil go bhfuil na comhpháirteanna “le feiceáil” de réir mar a íoslódáltar an comhad (mar atá i JPEG).

20 bliain ó shin, nuair a tugadh isteach an fhormáid seo, luchtaíodh an leathanach i dtrí chéim: ar dtús luchtaíodh an chomhpháirt téacs, tar éis cúpla soicind luchtaíodh na chéad leaganacha de na híomhánna agus an cúlra. Ina dhiaidh sin, bhí leathanach iomlán an leabhair “le feiceáil.”

Ceadaíonn láithreacht struchtúr trí leibhéal duit cuardach a dhéanamh trí leabhair scanta (toisc go bhfuil ciseal téacs speisialta ann). Bhí sé seo áisiúil nuair a bhíothas ag obair le litríocht theicniúil agus leabhair thagartha, agus mar sin bhí DjVu mar bhunús le roinnt leabharlanna leabhar eolaíochta. Mar shampla, i 2002 a roghnaíodh é Cartlann Idirlín mar cheann de na formáidí (mar aon le TIFF agus PDF) do thionscadal chun leabhair scanta ó fhoinsí oscailte a chaomhnú.

Míbhuntáistí an fhormáid

Mar sin féin, cosúil le gach teicneolaíocht, tá a míbhuntáistí ag DjVu. Mar shampla, agus scananna leabhar á n-ionchódú isteach i bhformáid DjVu, d’fhéadfadh carachtair eile atá cosúil lena gcuma a chur in ionad carachtair áirithe sa doiciméad. Tarlaíonn sé seo go minic leis na litreacha “i” agus “n”, agus sin an fáth a bhfuil an fhadhb seo ann a fuarthas ainm "ceann fadhb". Ní bhraitheann sé ar theanga an téacs agus bíonn tionchar aige, i measc rudaí eile, ar uimhreacha agus ar charachtair bheaga athfhillteacha eile.

Earráidí rangaithe carachtar san ionchódóir JB2 is cúis leis. “Scannann” sé ina ngrúpaí de 10-20 píosa agus cruthaíonn sé foclóir siombailí coitianta do gach grúpa. Tá samplaí san fhoclóir de litreacha agus de ghnáthuimhreacha le leathanaigh agus comhordanáidí dá gcuma. Nuair a fheiceann tú leabhar DjVu, cuirtear carachtair ón bhfoclóir isteach sna háiteanna cearta.

Ligeann sé seo duit méid an chomhaid DjVu a laghdú, áfach, má tá taispeántais dhá litir cosúil ó thaobh amhairc de, is féidir leis an ionchódóir iad a chur amú nó iad a dhearmad mar gheall ar an gcéanna. Uaireanta déanann sé seo damáiste d'fhoirmlí i ndoiciméad teicniúil. Chun an fhadhb seo a réiteach, is féidir leat na halgartaim comhbhrú a thréigean, ach méadóidh sé seo méid cóip dhigiteach an leabhair.

Míbhuntáiste eile den fhormáid ná nach bhfuil sé tacaithe go réamhshocraithe i go leor córais oibriúcháin nua-aimseartha (lena n-áirítear cinn soghluaiste). Dá bhrí sin, chun oibriú leis is gá duit a shuiteáil tríú páirtí cláir, mar shampla DjVuReader, WinDjView, Evince, etc. Mar sin féin, ba mhaith liom a thabhairt faoi deara anseo go dtacaíonn roinnt léitheoirí leictreonacha (mar shampla, ONYX BOOX) leis an bhformáid DjVu “as an mbosca” - ós rud é go bhfuil na feidhmchláir riachtanacha suiteáilte ann cheana féin.

Dála an scéil, labhair muid faoi cad eile is féidir le feidhmchláir do léitheoirí bunaithe ar Android a dhéanamh i gceann de na cinn roimhe seo ábhair.

R-leabhair agus a bhformáidí: DjVu - a stair, buntáistí, míbhuntáistí agus gnéithe
Léitheoir ONYX BOOX Chronos

Fadhb formáid eile le feiceáil agus iad ag obair le doiciméid DjVu ar scáileáin bheaga de ghléasanna soghluaiste - fóin chliste, táibléad, léitheoirí. Uaireanta cuirtear comhaid DjVu i láthair i bhfoirm scanadh ar leathadh leabhar, agus is minic a bhíonn litríocht ghairmiúil agus doiciméid oibre i bhformáid A4, mar sin caithfidh tú an íomhá a “bhog” ar thóir faisnéise.

Mar sin féin, tugaimid faoi deara gur féidir an fhadhb seo a réiteach freisin. Is é an bealach is éasca, ar ndóigh, ná doiciméad a chuardach i bhformáid dhifriúil - ach mura bhfuil an rogha seo indéanta (mar shampla, ní mór duit oibriú le cuid mhór de litríocht theicniúil i DjVu), ansin is féidir leat léitheoirí leictreonacha a úsáid. le trasnán mór ó 9,7 go 13,3 orlach, a "in oiriúint" go speisialta chun oibriú le doiciméid den sórt sin.

Mar shampla, sa líne ONYX BOOX tá feistí den sórt sin Chronos и MAX 2 (dála an scéil, tá athbhreithniú ullmhaithe againn ar an tsamhail léitheoir seo, agus foilseoidh sé go luath ar ár bhlag), agus freisin nótaí, a bhfuil scáileán E Ink Mobius Carta aige le trasnánach 10,3 orlach agus réiteach méadaithe. Ligeann feistí den sórt sin duit sonraí uile na léaráidí a scrúdú go socair ina méid bunaidh agus tá siad oiriúnach dóibh siúd a gcaithfidh litríocht oideachais nó theicniúil a léamh go minic. Chun féachaint ar djvu agus comhaid pdf a úsáidtear NEO Reader, a ligeann duit codarsnacht agus tiús na gclónna digitithe a choigeartú.

In ainneoin easnaimh na formáide, tá DjVu fós ar cheann de na formáidí is mó tóir ar shaothair liteartha a “chaomhnú”. Tá sé seo den chuid is mó mar gheall ar an bhfíric go bhfuil sé Is é oscailte, agus cuireann teorainneacha teicneolaíochta áirithe ar chumas teicneolaíochtaí agus forbairtí nua-aimseartha é a sheachbhóthar.

Sna hábhair seo a leanas leanfaimid leis an scéal faoi stair theacht chun cinn formáidí ríomhleabhar agus gnéithe a gcuid oibre.

PS Roinnt tacair de léitheoirí ONYX BOOX:



Foinse: will.com

Add a comment