Awọn iwe e-iwe ati awọn ọna kika wọn: DjVu - itan rẹ, awọn anfani, awọn alailanfani ati awọn ẹya

Ni awọn tete 70s, awọn American onkqwe Michael Hart isakoso gba iraye si ailopin si kọnputa Xerox Sigma 5 ti a fi sori ẹrọ ni University of Illinois. Lati lo awọn ohun elo ẹrọ naa daradara, o pinnu lati ṣẹda iwe itanna akọkọ, ti o tun ṣe ikede Ikede Ominira AMẸRIKA.

Loni, awọn iwe-iwe oni-nọmba ti di ibigbogbo, paapaa ọpẹ si idagbasoke awọn ẹrọ to ṣee gbe (awọn foonu alagbeka, awọn oluka e-iwe, kọǹpútà alágbèéká). Eyi ti yori si ifarahan ti nọmba nla ti awọn ọna kika e-iwe. Jẹ ki a gbiyanju lati ni oye awọn ẹya wọn ki o sọ itan-akọọlẹ ti olokiki julọ ninu wọn - jẹ ki a bẹrẹ pẹlu ọna kika DjVu.

Awọn iwe e-iwe ati awọn ọna kika wọn: DjVu - itan rẹ, awọn anfani, awọn alailanfani ati awọn ẹya
/flickr/ Lane Pearman / CC

Awọn farahan ti awọn kika

DjVu jẹ idagbasoke ni ọdun 1996 nipasẹ AT&T Labs pẹlu idi kan - lati fun awọn olupilẹṣẹ wẹẹbu ni irinṣẹ fun pinpin awọn aworan ti o ga lori Intanẹẹti.

Otitọ ni pe ni akoko yẹn 90% ti gbogbo alaye jẹ ṣi ti a ti fipamọ lori iwe, ati ọpọlọpọ awọn pataki awọn iwe aṣẹ ní awọ awọn aworan ati awọn fọto wà. Lati ṣetọju kika ti ọrọ ati didara awọn aworan, o jẹ dandan lati ṣe awọn iwoye ti o ga.

Awọn ọna kika oju opo wẹẹbu Ayebaye - JPEG, GIF ati PNG - jẹ ki o ṣee ṣe lati ṣiṣẹ pẹlu iru awọn aworan, ṣugbọn ni idiyele iwọn didun. Ninu ọran ti JPEG, ki ọrọ naa a ti ka loju iboju atẹle, Mo ni lati ọlọjẹ iwe naa pẹlu ipinnu ti 300 dpi. Oju-iwe awọ ti iwe irohin naa gba nipa 500 KB. Gbigba awọn faili ti iwọn yii lati Intanẹẹti jẹ ilana ti o lekoko pupọ ni akoko yẹn.

Yiyan ni lati ṣe digitize awọn iwe aṣẹ iwe ni lilo awọn imọ-ẹrọ OCR, ṣugbọn ni ọdun 20 sẹyin deede wọn jinna lati bojumu - lẹhin sisẹ, abajade ikẹhin ni lati ṣatunkọ ni pataki nipasẹ ọwọ. Ni akoko kanna, awọn aworan ati awọn aworan wa ni "oke". Ati paapaa ti o ba ṣee ṣe lati fi aworan ti a ṣayẹwo sinu iwe ọrọ, diẹ ninu awọn alaye wiwo ti sọnu, fun apẹẹrẹ, awọ ti iwe naa, ọrọ-ara rẹ, ati pe iwọnyi jẹ awọn paati pataki ti awọn iwe itan.

Lati le yanju awọn iṣoro wọnyi, AT&T ni idagbasoke DjVu. O jẹ ki o ṣee ṣe lati compress awọn iwe aṣẹ awọ ti a ṣayẹwo pẹlu ipinnu ti 300 dpi si 40–60 KB, pẹlu iwọn atilẹba ti 25 MB. DjVu dinku iwọn awọn oju-iwe dudu ati funfun si 10–30 KB.

Bawo ni DjVu compresses awọn iwe aṣẹ

DjVu le ṣiṣẹ pẹlu awọn iwe aṣẹ ti ṣayẹwo mejeeji ati awọn ọna kika oni-nọmba miiran, bii PDF. Bawo ni DjVu ṣiṣẹ irọ imọ-ẹrọ ti o pin aworan naa si awọn paati mẹta: iwaju, abẹlẹ ati iboju dudu ati funfun (bit).

Boju-boju ti wa ni fipamọ ni ipinnu ti faili atilẹba ati ni ninu aworan ti ọrọ ati awọn miiran ko o alaye - itanran ila ati awọn aworan atọka - bi daradara bi contrasting awọn aworan.

O ni ipinnu ti 300 dpi lati tọju awọn laini itanran ati awọn itọka lẹta didasilẹ, ati pe o jẹ fisinuirindigbindigbin nipa lilo algoridimu JB2, eyiti o jẹ iyatọ ti AT&T's JBIG2 algorithm fun faxing. Ẹya-ara ti JB2 jẹ ẹya ohun ti o ṣe ni o n wa awọn ohun kikọ ẹda-iwe lori oju-iwe ati fi aworan wọn pamọ ni ẹẹkan. Nitorinaa, ninu awọn iwe aṣẹ oju-iwe pupọ, gbogbo awọn oju-iwe itẹlera diẹ pin “itumọ-itumọ” ti o wọpọ.

Ipilẹ ni awọn sojurigindin ti oju-iwe ati awọn apejuwe, ati pe ipinnu rẹ kere ju ti iboju-boju naa. Isalẹ ti ko padanu ti wa ni ipamọ ni 100 dpi.

Iwaju awọn ile itaja alaye awọ nipa iboju-boju, ati ipinnu rẹ nigbagbogbo dinku paapaa siwaju, nitori ni ọpọlọpọ igba awọ ọrọ jẹ dudu ati kanna fun ohun kikọ ti a tẹjade. Lo lati compress awọn iwaju ati lẹhin wavelet funmorawon.

Ipele ikẹhin ti ṣiṣẹda iwe-ipamọ DjVu jẹ fifi koodu entropy, nigbati koodu iṣiro imuṣiṣẹpọ kan yipada awọn ilana ti awọn ohun kikọ kanna si iye alakomeji kan.

Awọn anfani ti ọna kika

DjVu ká-ṣiṣe wà fipamọ "Awọn ohun-ini" ti iwe-iwe ni fọọmu oni-nọmba, gbigba paapaa awọn kọmputa ti ko lagbara lati ṣiṣẹ pẹlu iru awọn iwe aṣẹ. Nitorinaa, sọfitiwia fun wiwo awọn faili DjVu ni agbara lati “fifiranṣẹ ni iyara”. O ṣeun fun u ni iranti ikojọpọ nikan nkan ti oju-iwe DjVu ti o yẹ ki o han loju iboju.

Eyi tun jẹ ki o ṣee ṣe lati wo awọn faili “aigbasilẹ”, iyẹn ni, awọn oju-iwe kọọkan ti iwe-iwe DjVu olopo-oju-iwe kan. Ni ọran yii, iyaworan ilọsiwaju ti awọn alaye aworan ni a lo, nigbati awọn paati dabi “han” bi faili ti ṣe igbasilẹ (bii ninu JPEG).

20 ọdun sẹyin, nigbati a ṣe agbekalẹ kika yii, oju-iwe naa ti kojọpọ ni awọn ipele mẹta: akọkọ ti kojọpọ paati ọrọ, lẹhin iṣẹju-aaya awọn ẹya akọkọ ti awọn aworan ati lẹhin ti kojọpọ. Lẹhinna, gbogbo oju-iwe ti iwe naa “farahan.”

Iwaju eto ipele mẹta tun gba ọ laaye lati wa nipasẹ awọn iwe ti a ṣayẹwo (bi o ṣe jẹ pe Layer ọrọ pataki kan wa). Eyi wa ni irọrun nigbati o n ṣiṣẹ pẹlu awọn iwe imọ-ẹrọ ati awọn iwe itọkasi, nitorinaa DjVu di ipilẹ fun ọpọlọpọ awọn ile-ikawe ti awọn iwe imọ-jinlẹ. Fun apẹẹrẹ, ni 2002 o ti yan Internet Archive bi ọkan ninu awọn ọna kika (pẹlu TIFF ati PDF) fun ise agbese kan lati se itoju ti ṣayẹwo awọn iwe ohun lati ìmọ awọn orisun.

Awọn alailanfani ti ọna kika

Sibẹsibẹ, bii gbogbo awọn imọ-ẹrọ, DjVu ni awọn abawọn rẹ. Fun apẹẹrẹ, nigba fifi koodu si awọn iwo ti awọn iwe sinu ọna kika DjVu, diẹ ninu awọn ohun kikọ ninu iwe le rọpo nipasẹ awọn miiran ti o jọra ni irisi. Eyi nigbagbogbo n ṣẹlẹ pẹlu awọn lẹta “i” ati “n”, eyiti o jẹ idi iṣoro yii gba lorukọ "iṣoro yin". Ko da lori ede ti ọrọ naa ati ni ipa, ninu awọn ohun miiran, awọn nọmba ati awọn ohun kikọ kekere ti o tun ṣe.

Idi rẹ jẹ awọn aṣiṣe isọdi ohun kikọ ninu koodu koodu JB2. O “pin” n ṣe ayẹwo si awọn ẹgbẹ ti awọn ege 10-20 ati pe o ṣe iwe-itumọ ti awọn aami ti o wọpọ fun ẹgbẹ kọọkan. Iwe-itumọ naa ni awọn apẹẹrẹ ti awọn lẹta ti o wọpọ ati awọn nọmba pẹlu awọn oju-iwe ati awọn ipoidojuko ti irisi wọn. Nigbati o ba wo iwe DjVu, awọn ohun kikọ lati inu iwe-itumọ ni a fi sii si awọn aye to tọ.

Eyi n gba ọ laaye lati dinku iwọn faili DjVu, sibẹsibẹ, ti awọn ifihan ti awọn lẹta meji ba jọra ni oju, koodu koodu le daru wọn tabi ṣina wọn fun kanna. Nigba miiran eyi nyorisi ibajẹ si awọn agbekalẹ ninu iwe imọ-ẹrọ. Lati yanju iṣoro yii, o le kọ awọn algoridimu funmorawon silẹ, ṣugbọn eyi yoo mu iwọn ti ẹda oni-nọmba ti iwe naa pọ si.

Alailanfani miiran ti ọna kika ni pe ko ṣe atilẹyin nipasẹ aiyipada ni ọpọlọpọ awọn ọna ṣiṣe igbalode (pẹlu awọn alagbeka). Nitorina, lati ṣiṣẹ pẹlu rẹ o nilo lati fi sori ẹrọ ẹni-kẹta eto naa, gẹgẹbi DjVuReader, WinDjView, Evince, bbl Sibẹsibẹ, nibi Emi yoo fẹ lati ṣe akiyesi pe diẹ ninu awọn oluka itanna (fun apẹẹrẹ, ONYX BOOX) ṣe atilẹyin ọna kika DjVu "lati inu apoti" - niwon awọn ohun elo pataki ti wa tẹlẹ ti fi sori ẹrọ nibẹ.

Nipa ọna, a sọrọ nipa kini awọn ohun elo miiran fun awọn oluka orisun Android le ṣe ni ọkan ninu awọn iṣaaju awọn ohun elo.

Awọn iwe e-iwe ati awọn ọna kika wọn: DjVu - itan rẹ, awọn anfani, awọn alailanfani ati awọn ẹya
Oluka ONYX BOOX Chronos

Iṣoro ọna kika miiran han nigbati o n ṣiṣẹ pẹlu awọn iwe DjVu lori awọn iboju kekere ti awọn ẹrọ alagbeka - awọn fonutologbolori, awọn tabulẹti, awọn oluka. Nigba miiran awọn faili DjVu ni a gbekalẹ ni irisi ọlọjẹ ti itankale iwe kan, ati awọn iwe alamọdaju ati awọn iwe aṣẹ ṣiṣẹ nigbagbogbo ni ọna kika A4, nitorinaa o ni lati “gbe” aworan naa ni wiwa alaye.

Sibẹsibẹ, a ṣe akiyesi pe iṣoro yii tun le yanju. Ọna to rọọrun, nitorinaa, ni lati wa iwe-ipamọ ni ọna kika ti o yatọ - ṣugbọn ti aṣayan yii ko ba ṣeeṣe (fun apẹẹrẹ, o nilo lati ṣiṣẹ pẹlu iye nla ti awọn iwe imọ-ẹrọ ni DjVu), lẹhinna o le lo awọn oluka itanna. pẹlu akọ-rọsẹ nla lati 9,7 si 13,3 inches, eyiti o jẹ "apẹrẹ" pataki fun ṣiṣẹ pẹlu iru awọn iwe aṣẹ.

Fun apẹẹrẹ, ninu laini ONYX BOOX iru awọn ẹrọ wa Chronos и Max 2 (nipasẹ ọna, a ti pese atunyẹwo ti awoṣe oluka yii, ati pe yoo tẹjade laipe lori bulọọgi wa), ati paapaa akọsilẹ, eyiti o ni iboju E Ink Mobius Carta pẹlu diagonal ti 10,3 inches ati ipinnu ti o pọ sii. Awọn iru ẹrọ bẹẹ gba ọ laaye lati ṣe ayẹwo ni ifọkanbalẹ gbogbo awọn alaye ti awọn apejuwe ni iwọn atilẹba wọn ati pe o dara fun awọn ti o nigbagbogbo ni lati ka awọn iwe-ẹkọ ẹkọ tabi imọ-ẹrọ. Lati wo DjVu ati awọn faili PDF o ti lo Oluka NEO, eyiti o fun ọ laaye lati ṣatunṣe iyatọ ati sisanra ti awọn nkọwe digitized.

Pelu awọn ailagbara ọna kika, loni DjVu jẹ ọkan ninu awọn ọna kika olokiki julọ fun “titọju” awọn iṣẹ iwe-kikọ. Eleyi jẹ ibebe nitori si ni otitọ wipe o jẹ ẹya ṣii, ati diẹ ninu awọn idiwọn imọ-ẹrọ loni gba awọn imọ-ẹrọ igbalode ati awọn idagbasoke laaye lati fori rẹ.

Ninu awọn ohun elo atẹle a yoo tẹsiwaju itan naa nipa itan-akọọlẹ ti ifarahan ti awọn ọna kika e-iwe ati awọn ẹya ara ẹrọ ti iṣẹ wọn.

PS Orisirisi awọn eto ti awọn oluka ONYX BOOX:



orisun: www.habr.com

Fi ọrọìwòye kun