E-mabuku ndi mawonekedwe awo: DjVu - mbiri yake, zabwino zake, zoyipa ndi mawonekedwe ake

Kumayambiriro kwa zaka za m'ma 70, wolemba waku America Michael Hart adakwanitsa tenga mwayi wopanda malire pakompyuta ya Xerox Sigma 5 yoyikidwa ku yunivesite ya Illinois. Kuti agwiritse ntchito bwino zida zamakina, adaganiza zopanga buku loyamba lamagetsi, kusindikizanso Chidziwitso cha Ufulu wa US.

Masiku ano, mabuku a digito afalikira, makamaka chifukwa cha chitukuko cha zipangizo zamakono (mafoni a m'manja, e-readers, laptops). Izi zapangitsa kuti pakhale mawonekedwe ambiri a e-book. Tiyeni tiyese kumvetsetsa mawonekedwe awo ndikuwuza mbiri ya otchuka kwambiri mwa iwo - tiyeni tiyambe ndi mtundu wa DjVu.

E-mabuku ndi mawonekedwe awo: DjVu - mbiri yake, zabwino zake, zoyipa ndi mawonekedwe ake
/flickr/ Lane Pearman / CC

Kuwonekera kwa mawonekedwe

DjVu idapangidwa mu 1996 ndi AT&T Labs ndi cholinga chimodzi - kupatsa opanga mawebusayiti chida chogawa zithunzi zowoneka bwino pa intaneti.

Chowonadi ndi chakuti panthawiyo 90% ya chidziwitso chonse akadali inasungidwa papepala, ndipo zambiri mwazolemba zofunika zinali ndi zithunzi zamitundumitundu ndi zithunzi. Kuti zolembazo zikhale zomveka bwino komanso kuti zithunzizo zikhale zabwino, kunali koyenera kupanga masikelo apamwamba.

Mawonekedwe akale a intaneti - JPEG, GIF ndi PNG - adapangitsa kuti zitheke kugwira ntchito ndi zithunzi zotere, koma pamtengo wa voliyumu. Pankhani ya JPEG, kuti malembawo inawerengedwa Pazenera loyang'anira, ndimayenera kuyang'ana chikalatacho ndi 300 dpi. Tsamba lamtundu wa magaziniyo lidatenga pafupifupi 500 KB. Kutsitsa mafayilo amtundu uwu pa intaneti inali ntchito yovuta kwambiri panthawiyo.

Njira ina inali yosinthira zikalata zamapepala pogwiritsa ntchito matekinoloje a OCR, koma zaka 20 zapitazo kulondola kwawo sikunali koyenera - pambuyo pokonza, zotsatira zomaliza zidayenera kusinthidwa ndi dzanja. Panthawi imodzimodziyo, zithunzi ndi zithunzi zinakhalabe "zambiri". Ndipo ngakhale zikanakhala zotheka kuyika chithunzi chojambulidwa mu chikalata cholembedwa, zina zowonongeka zinatayika, mwachitsanzo, mtundu wa pepala, mawonekedwe ake, ndipo izi ndi zigawo zofunika za zolemba zakale.

Kuti athetse mavutowa, AT&T idapanga DjVu. Zinapangitsa kuti zitheke kufinya zikalata zamitundu yojambulidwa ndi 300 dpi mpaka 40-60 KB, ndi kukula koyambirira kwa 25 MB. DjVu inachepetsa kukula kwa masamba akuda ndi oyera mpaka 10-30 KB.

Momwe DjVu imakanizira zolemba

DjVu imatha kugwira ntchito ndi mapepala ojambulidwa ndi mitundu ina ya digito, monga PDF. Momwe DjVu imagwirira ntchito mabodza teknoloji yomwe imagawanitsa chithunzicho kukhala zigawo zitatu: kutsogolo, kumbuyo ndi chigoba chakuda ndi choyera (bit).

Chigobacho chimasungidwa pakusintha kwa fayilo yoyambirira ndi lili ndi chithunzi cha malemba ndi zina zomveka bwino - mizere yabwino ndi zojambula - komanso zithunzi zosiyana.

Ili ndi kusamvana kwa 300 dpi kuti mizere yabwino ndi mafotokozedwe a zilembo kukhala yakuthwa, ndipo imapanikizidwa pogwiritsa ntchito algorithm ya JB2, yomwe ndikusintha kwa algorithm ya AT&T's JBIG2 yotumizira fakisi. Chithunzi cha JB2 ndi chomwe imachita ndikuyang'ana zilembo zobwereza patsamba ndikusunga zithunzi zawo kamodzi kokha. Chifukwa chake, muzolemba zamasamba ambiri, masamba angapo otsatizana amagawana "dictionary" wamba.

Kumbuyo kuli ndi mawonekedwe a tsamba ndi zithunzi, ndipo mawonekedwe ake ndi otsika kuposa a chigoba. Kumbuyo kosatayika kumasungidwa pa 100 dpi.

Patsogolo masitolo zambiri zamtundu wa chigoba, ndipo mawonekedwe ake nthawi zambiri amachepetsedwa kwambiri, chifukwa nthawi zambiri mtundu wa mawuwo ndi wakuda komanso wofanana pamunthu umodzi wosindikizidwa. Amagwiritsidwa ntchito kukakamiza kutsogolo ndi kumbuyo compression wavelet.

Gawo lomaliza la kupanga chikalata cha DjVu ndi entropy encoding, pomwe ma encoder osinthika a masamu amasintha kutsatizana kwa zilembo zofanana kukhala mtengo wa binary.

Ubwino wa mawonekedwe

Ntchito ya DjVu inali sungani "katundu" wa chikalata cha pepala mu mawonekedwe a digito, kulola ngakhale makompyuta ofooka kugwira ntchito ndi zolemba zoterozo. Chifukwa chake, mapulogalamu owonera mafayilo a DjVu amatha "kutulutsa mwachangu". Zikomo kwa iye pokumbukira kutsitsa Chigawo chokhacho cha tsamba la DjVu chomwe chiyenera kuwonetsedwa pazenera.

Izi zimathandizanso kuti muwone mafayilo "osatsitsidwa", ndiye kuti, masamba amtundu wamasamba ambiri a DjVu. Pachifukwa ichi, kujambula kwapang'onopang'ono kwazithunzi kumagwiritsidwa ntchito, pamene zigawozo zikuwoneka kuti "zikuwonekera" pamene fayilo imatsitsidwa (monga JPEG).

Zaka 20 zapitazo, pamene mawonekedwewa adayambitsidwa, tsambalo lidakwezedwa m'magawo atatu: choyamba gawo lolemba lidakwezedwa, patatha masekondi angapo mitundu yoyambirira ya zithunzi ndi maziko adakwezedwa. Pambuyo pake, tsamba lonse la bukhulo β€œlinawonekera.”

Kukhalapo kwa kapangidwe ka magawo atatu kumakupatsaninso mwayi wofufuza m'mabuku osakanizidwa (popeza pali gawo lapadera). Izi zidakhala zosavuta pogwira ntchito ndi zolemba zamaluso ndi zolemba, kotero DjVu idakhala maziko a malaibulale angapo a mabuku asayansi. Mwachitsanzo, mu 2002 anasankhidwa Internet Archive monga imodzi mwamawonekedwe (pamodzi ndi TIFF ndi PDF) ya pulojekiti yosungira mabuku osakanizidwa kuchokera kumalo otseguka.

Kuipa kwa mawonekedwe

Komabe, monga matekinoloje onse, DjVu ili ndi zovuta zake. Mwachitsanzo, mukasindikiza ma encoding a mabuku mu mtundu wa DjVu, zilembo zina mu chikalatacho zitha kusinthidwa ndi zina zofananira. Izi zimachitika nthawi zambiri ndi zilembo "i" ndi "n", chifukwa chake vutoli cholandiridwa dzina "vuto yin". Sizidalira chinenero cha malemba ndipo zimakhudza, mwa zina, manambala ndi zilembo zina zazing'ono zobwerezabwereza.

Chifukwa chake ndi zolakwika zamagulu mu JB2 encoder. "Imagawa" imayang'ana m'magulu a zidutswa 10-20 ndikupanga dikishonale ya zizindikiro zodziwika pagulu lililonse. Mtanthauzira mawu ali ndi zitsanzo za zilembo wamba ndi manambala okhala ndi masamba ndi makonzedwe a maonekedwe awo. Mukawona buku la DjVu, zilembo za mtanthauzira mawu zimayikidwa m'malo oyenera.

Izi zimakuthandizani kuti muchepetse kukula kwa fayilo ya DjVu, komabe, ngati zowonetsa zilembo ziwiri zikufanana, chosindikizacho chingathe kuwasokoneza kapena kuwasokoneza chimodzimodzi. Nthawi zina izi zimabweretsa kuwonongeka kwa mafomu mu chikalata chaukadaulo. Kuti muthane ndi vutoli, mutha kusiya ma aligorivimu oponderezedwa, koma izi zidzakulitsa kukula kwa buku la digito.

Choyipa china cha mawonekedwe ndikuti sichimathandizidwa ndi machitidwe ambiri amakono (kuphatikiza mafoni). Chifukwa chake, kuti mugwire nawo ntchito muyenera kukhazikitsa chipani chachitatu mapulogalamu, monga DjVuReader, WinDjView, Evince, etc. Komabe, apa ndikufuna kuzindikira kuti ena owerenga zamagetsi (mwachitsanzo, ONYX BOOX) amathandizira mawonekedwe a DjVu "kunja kwa bokosi" - popeza mapulogalamu ofunikira aikidwa kale pamenepo.

Mwa njira, tidakambirana za zomwe mapulogalamu a owerenga ozikidwa pa Android angachite m'mbuyomu zida.

E-mabuku ndi mawonekedwe awo: DjVu - mbiri yake, zabwino zake, zoyipa ndi mawonekedwe ake
Wowerenga ONYX BOOX Chronos

Vuto lina la mawonekedwe limawoneka mukamagwira ntchito ndi zolemba za DjVu paziwonetsero zazing'ono zama foni am'manja - mafoni, mapiritsi, owerenga. Nthawi zina mafayilo a DjVu amawonetsedwa ngati jambulani kufalikira kwa bukhu, ndipo zolemba zamaluso ndi zolemba zogwirira ntchito nthawi zambiri zimakhala mumtundu wa A4, chifukwa chake muyenera "kusuntha" chithunzicho pofufuza zambiri.

Komabe, tikuwona kuti vutoli lingathenso kuthetsedwa. Njira yosavuta, ndithudi, ndiyo kuyang'ana chikalata mumtundu wina - koma ngati sizingatheke (mwachitsanzo, muyenera kugwira ntchito ndi mabuku ambiri aukadaulo mu DjVu), ndiye kuti mutha kugwiritsa ntchito owerenga zamagetsi. yokhala ndi diagonal yayikulu kuyambira mainchesi 9,7 mpaka 13,3, yomwe makamaka "yokonzedwa" kuti igwire ntchito ndi zolemba zotere.

Mwachitsanzo, pamzere wa ONYX BOOX zida zotere zili Mbiri ΠΈ MAX 2 (mwa njira, takonzekera ndemanga ya chitsanzo cha owerenga awa, ndipo posachedwa tidzafalitsa pa blog yathu), komanso Zindikirani, yomwe ili ndi skrini ya E Ink Mobius Carta yokhala ndi diagonal ya mainchesi 10,3 ndikusintha kowonjezereka. Zida zoterezi zimakulolani kuti mufufuze mosamala zonse za mafanizo mu kukula kwake koyambirira ndipo ndizoyenera kwa iwo omwe nthawi zambiri amawerenga mabuku a maphunziro kapena luso. Kuti muwone mafayilo a DjVu ndi PDF imagwiritsidwa ntchito NEO Reader, yomwe imakulolani kuti musinthe kusiyana ndi makulidwe a zilembo zama digito.

Ngakhale pali zolakwika za mtunduwo, lero DjVu ikadali imodzi mwamawonekedwe otchuka kwambiri a "kusunga" zolembalemba. Izi makamaka chifukwa chakuti iye ndi lotseguka, ndipo zoletsa zina zaukadaulo masiku ano zimalola umisiri wamakono ndi chitukuko kuzilambalala.

M'zinthu zotsatirazi tidzapitiriza nkhani ya mbiri yakale ya maonekedwe a e-book ndi mawonekedwe a ntchito yawo.

PS Ma seti angapo a owerenga a ONYX BOOX:



Source: www.habr.com

Kuwonjezera ndemanga