Vitabu vya E-vitabu na muundo wao: DjVu - historia yake, faida, hasara na vipengele

Katika miaka ya 70 ya mapema, mwandishi wa Amerika Michael Hart aliweza kupata ufikiaji usio na kikomo wa kompyuta ya Xerox Sigma 5 iliyosakinishwa katika Chuo Kikuu cha Illinois. Ili kutumia vyema rasilimali za mashine hiyo, aliamua kuunda kitabu cha kwanza cha kielektroniki, na kuchapisha tena Azimio la Uhuru la Marekani.

Leo, fasihi ya dijiti imeenea, kwa kiasi kikubwa kutokana na maendeleo ya vifaa vya kubebeka (smartphones, e-readers, laptops). Hii imesababisha kuibuka kwa idadi kubwa ya miundo ya e-book. Hebu jaribu kuelewa vipengele vyao na tuambie historia ya maarufu zaidi kati yao - hebu tuanze na muundo wa DjVu.

Vitabu vya E-vitabu na muundo wao: DjVu - historia yake, faida, hasara na vipengele
/flickr/ Njia ya Pearman / CC

Kuibuka kwa muundo

DjVu ilitengenezwa mwaka wa 1996 na AT&T Labs kwa lengo moja - kuwapa watengenezaji wa wavuti zana ya kusambaza picha zenye mwonekano wa juu kwenye Mtandao.

Ukweli ni kwamba wakati huo 90% ya habari zote bado ilihifadhiwa kwenye karatasi, na hati nyingi muhimu zilikuwa na picha za rangi na picha. Ili kudumisha usomaji wa maandishi na ubora wa picha, ilikuwa ni lazima kufanya uchunguzi wa juu-azimio.

Miundo ya awali ya mtandao - JPEG, GIF na PNG - ilifanya iwezekanavyo kufanya kazi na picha hizo, lakini kwa gharama ya kiasi. Katika kesi ya JPEG, ili maandishi ilisomwa kwenye skrini ya kufuatilia, nililazimika kuchambua hati na azimio la 300 dpi. Ukurasa wa rangi wa gazeti ulichukua takriban 500 KB. Kupakua faili za ukubwa huu kutoka kwa Mtandao ulikuwa mchakato wa kazi sana wakati huo.

Njia mbadala ilikuwa kuweka hati za karatasi kwa dijiti kwa kutumia teknolojia za OCR, lakini miaka 20 iliyopita usahihi wao ulikuwa mbali na bora - baada ya usindikaji, matokeo ya mwisho yalibidi kuhaririwa kwa mkono. Wakati huo huo, picha na picha zilibaki "zaidi". Na hata ikiwa inawezekana kupachika picha iliyochanganuliwa kwenye hati ya maandishi, baadhi ya maelezo ya kuona yalipotea, kwa mfano, rangi ya karatasi, texture yake, na haya ni vipengele muhimu vya nyaraka za kihistoria.

Ili kutatua matatizo haya, AT&T ilitengeneza DjVu. Ilifanya iwezekane kubana hati za rangi zilizochanganuliwa na azimio la 300 dpi hadi 40-60 KB, na ukubwa wa asili wa 25 MB. DjVu ilipunguza ukubwa wa kurasa nyeusi na nyeupe hadi KB 10–30.

Jinsi DjVu inavyobana hati

DjVu inaweza kufanya kazi na hati za karatasi zilizochanganuliwa na miundo mingine ya dijiti, kama vile PDF. Jinsi DjVu inavyofanya kazi uongo teknolojia ambayo inagawanya picha katika vipengele vitatu: mbele, background na nyeusi na nyeupe (bit) mask.

Mask imehifadhiwa kwa azimio la faili ya asili na ina picha ya maandishi na maelezo mengine ya wazi - mistari nzuri na michoro - pamoja na picha tofauti.

Ina msongo wa dpi 300 ili kuweka laini laini na muhtasari wa herufi kwa ukali, na imebanwa kwa kutumia algoriti ya JB2, ambayo ni tofauti ya algoriti ya AT&T ya JBIG2 ya kutuma faksi. Kipengele cha JB2 ni inachofanya ni kutafuta vibambo nakala kwenye ukurasa na huhifadhi picha zao mara moja tu. Kwa hivyo, katika hati za kurasa nyingi, kila kurasa chache mfululizo hushiriki "kamusi" ya kawaida.

Mandharinyuma yana muundo wa ukurasa na vielelezo, na azimio lake ni la chini kuliko la barakoa. Asili isiyo na hasara imehifadhiwa kwa 100 dpi.

Mbele maduka habari ya rangi kuhusu mask, na azimio lake kawaida hupunguzwa hata zaidi, kwa kuwa katika hali nyingi rangi ya maandishi ni nyeusi na sawa kwa tabia moja iliyochapishwa. Inatumika kukandamiza uso wa mbele na usuli ukandamizaji wa wimbi.

Hatua ya mwisho ya kuunda hati ya DjVu ni usimbaji entropy, wakati kisimbaji cha hesabu kinachoweza kubadilika kinabadilisha mlolongo wa herufi zinazofanana kuwa thamani ya binary.

Faida za muundo

Kazi ya DjVu ilikuwa kuokoa "mali" ya hati ya karatasi katika fomu ya digital, kuruhusu hata kompyuta dhaifu kufanya kazi na nyaraka hizo. Kwa hiyo, programu ya kutazama faili za DjVu ina uwezo wa "kutoa haraka". Asante kwake katika kumbukumbu kupakia kipande hicho tu cha ukurasa wa DjVu ambacho kinapaswa kuonyeshwa kwenye skrini.

Hii pia inafanya uwezekano wa kutazama faili "zisizopakuliwa", yaani, kurasa za kibinafsi za hati ya DjVu yenye kurasa nyingi. Katika kesi hii, mchoro unaoendelea wa maelezo ya picha hutumiwa, wakati vipengele vinaonekana "kuonekana" wakati faili inapakuliwa (kama katika JPEG).

Miaka 20 iliyopita, muundo huu ulipoanzishwa, ukurasa ulipakiwa katika hatua tatu: kwanza sehemu ya maandishi ilipakiwa, baada ya sekunde chache matoleo ya kwanza ya picha na mandharinyuma yalipakiwa. Baadaye, ukurasa mzima wa kitabu β€œulionekana.”

Uwepo wa muundo wa ngazi tatu pia unakuwezesha kutafuta kupitia vitabu vilivyochanganuliwa (kwani kuna safu maalum ya maandishi). Hii iligeuka kuwa rahisi wakati wa kufanya kazi na fasihi ya kiufundi na vitabu vya kumbukumbu, kwa hivyo DjVu ikawa msingi wa maktaba kadhaa za vitabu vya kisayansi. Kwa mfano, mwaka 2002 alichaguliwa Hifadhi ya Mtandao kama mojawapo ya miundo (pamoja na TIFF na PDF) ya mradi wa kuhifadhi vitabu vilivyochanganuliwa kutoka kwa vyanzo wazi.

Hasara za muundo

Walakini, kama teknolojia zote, DjVu ina shida zake. Kwa mfano, wakati wa kusimba skanisho za vitabu katika umbizo la DjVu, baadhi ya herufi kwenye hati zinaweza kubadilishwa na zingine zinazofanana kwa mwonekano. Hii mara nyingi hufanyika na herufi "i" na "n", ndiyo sababu shida hii imepokelewa jina "shida ya yin". Haitegemei lugha ya maandishi na huathiri, kati ya mambo mengine, nambari na wahusika wengine wadogo wa kurudia.

Sababu yake ni makosa ya uainishaji wa wahusika katika kisimbaji cha JB2. "Inagawanyika" skanning katika vikundi vya vipande 10-20 na kuunda kamusi ya alama za kawaida kwa kila kikundi. Kamusi ina mifano ya herufi na nambari za kawaida zilizo na kurasa na viwianishi vya mwonekano wao. Unapotazama kitabu cha DjVu, vibambo kutoka kwenye kamusi vinaingizwa katika sehemu zinazofaa.

Hii inakuwezesha kupunguza ukubwa wa faili ya DjVu, hata hivyo, ikiwa maonyesho ya barua mbili yanaonekana sawa, encoder inaweza kuwachanganya au kuwakosea sawa. Wakati mwingine hii inasababisha uharibifu wa kanuni katika hati ya kiufundi. Ili kutatua tatizo hili, unaweza kuachana na algorithms ya ukandamizaji, lakini hii itaongeza saizi ya nakala ya dijiti ya kitabu.

Hasara nyingine ya umbizo ni kwamba haijaungwa mkono na chaguo-msingi katika mifumo mingi ya uendeshaji ya kisasa (ikiwa ni pamoja na zile za rununu). Kwa hiyo, kufanya kazi nayo unahitaji kufunga mtu wa tatu mipango, kama vile DjVuReader, WinDjView, Evince, nk Hata hivyo, hapa ningependa kutambua kwamba baadhi ya wasomaji wa elektroniki (kwa mfano, ONYX BOOX) wanaunga mkono muundo wa DjVu "nje ya sanduku" - kwa kuwa maombi muhimu tayari yamewekwa hapo.

Kwa njia, tulizungumza juu ya kile programu zingine za wasomaji wa msingi wa Android zinaweza kufanya katika moja ya hapo awali vifaa.

Vitabu vya E-vitabu na muundo wao: DjVu - historia yake, faida, hasara na vipengele
Msomaji ONYX BOOX Chronos

Tatizo jingine la muundo linaonekana wakati wa kufanya kazi na nyaraka za DjVu kwenye skrini ndogo za vifaa vya simu - smartphones, vidonge, wasomaji. Wakati mwingine faili za DjVu zinawasilishwa kwa namna ya skanning ya kuenea kwa kitabu, na fasihi ya kitaaluma na nyaraka za kazi mara nyingi huwa katika muundo wa A4, kwa hiyo unapaswa "kusonga" picha katika kutafuta habari.

Hata hivyo, tunaona kwamba tatizo hili pia linaweza kutatuliwa. Njia rahisi, bila shaka, ni kutafuta hati katika muundo tofauti - lakini ikiwa chaguo hili haliwezekani (kwa mfano, unahitaji kufanya kazi na kiasi kikubwa cha maandiko ya kiufundi katika DjVu), basi unaweza kutumia wasomaji wa elektroniki. na diagonal kubwa kutoka kwa inchi 9,7 hadi 13,3, ambayo "iliyoundwa" haswa kwa kufanya kazi na hati kama hizo.

Kwa mfano, katika mstari wa ONYX BOOX vifaa vile ni Mambo ya nyakati ΠΈ MAX 2 (kwa njia, tumeandaa mapitio ya mfano huu wa msomaji, na hivi karibuni tutachapisha kwenye blogu yetu), na pia Kumbuka, ambayo ina skrini ya E Wino ya Mobius Carta yenye mlalo wa inchi 10,3 na mwonekano ulioongezeka. Vifaa vile vinakuwezesha kuchunguza kwa utulivu maelezo yote ya vielelezo katika ukubwa wao wa awali na yanafaa kwa wale ambao mara nyingi wanapaswa kusoma maandiko ya elimu au ya kiufundi. Ili kutazama faili za DjVu na PDF hutumiwa NEO Reader, ambayo inakuwezesha kurekebisha tofauti na unene wa fonti za dijiti.

Licha ya mapungufu ya fomati, leo DjVu inabaki kuwa moja ya fomati maarufu za "kuhifadhi" kazi za fasihi. Hii ni kwa kiasi kikubwa kutokana na ukweli kwamba yeye ni wazi, na baadhi ya mapungufu ya kiteknolojia leo huruhusu teknolojia za kisasa na maendeleo kuipita.

Katika nyenzo zifuatazo tutaendelea hadithi kuhusu historia ya kuibuka kwa muundo wa e-kitabu na vipengele vya kazi zao.

PS Seti kadhaa za wasomaji wa ONYX BOOX:



Chanzo: mapenzi.com

Kuongeza maoni