E-buugaagta iyo qaababkooda: DjVu - taariikhdeeda, faa'iidooyinka, khasaaraha iyo sifooyinka

Horraantii 70-meeyadii, qoraaga Mareykanka Michael Hart ayaa maamulay hel Helitaanka aan xadidnayn ee kombuyuutar Xerox Sigma 5 oo lagu rakibay Jaamacadda Illinois. Si uu si fiican uga faa’iidaysto agabka mishiinka, waxa uu go’aansaday in uu sameeyo buuggii ugu horeeyay ee elegtarooniga ah, isaga oo dib u daabacaya Baaqa Madaxbanaanida Maraykanka.

Maanta, suugaanta dhijitaalka ah ayaa noqotay mid baahsan, taas oo ay ugu wacan tahay horumarinta qalabka la qaadi karo (casriga, e-akhristayaasha, laptops). Tani waxay keentay in ay soo baxaan qaabab badan oo e-book ah. Aan isku dayno inaan fahanno sifooyinkooda oo aan u sheegno taariikhda kuwa ugu caansan iyaga - aan ku bilowno qaabka DjVu.

E-buugaagta iyo qaababkooda: DjVu - taariikhdeeda, faa'iidooyinka, khasaaraha iyo sifooyinka
/flickr/ Lane Pearman / CC

Soo ifbaxa qaabka

DjVu waxaa sameeyay 1996kii AT&T Shaybaadhka oo leh hal ujeedo - si loo siiyo horumariyayaasha webka qalab ay ku qaybiyaan sawirada xalinta sare leh ee internetka.

Xaqiiqdu waxay tahay in wakhtigaas 90% dhammaan macluumaadka ay weli yihiin ayaa la kaydiyay warqad, iyo qaar badan oo ka mid ah dukumentiyada muhiimka ah waxay lahaayeen sawirro midab leh iyo sawirro. Si loo ilaaliyo akhrinta qoraalka iyo tayada sawirada, waxay ahayd lagama maarmaan in la sameeyo sawiro heer sare ah.

Qaababka shabakada caadiga ah - JPEG, GIF iyo PNG - waxay suurtogal ka dhigeen in lagu shaqeeyo sawiradaas, laakiin qiimaha mugga. Xaaladda JPEG, si qoraalka ayaa la akhriyay Shaashada kormeeraha, waxaan ku khasbanaaday in aan sawiro dukumeentiga oo leh xallin 300 dpi ah. Bogga midabka ee joornaalka ayaa qabsaday ilaa 500 KB. Ka soo dejinta faylasha cabbirkan oo kale ah intarneedka waxay ahayd hab hawleed aad u xoog badan wakhtigaas.

Beddelku waxa uu ahaa in waraaqaha waraaqaha lagu digiteeyo iyadoo la adeegsanayo tignoolajiyada OCR, laakiin 20 sano ka hor saxnimadooda aad ayay uga fogaatay - ka dib habaynta, natiijada kama dambaysta ah waxay ahayd in si dhab ah gacanta loo tafatiro. Isla mar ahaantaana, garaafyada iyo sawiradu waxay ku hareen "korka". Xitaa haddii ay suurtagal tahay in lagu dhejiyo sawir la sawiray dukumeenti qoraal ah, faahfaahinta muuqaalka qaarkood ayaa lumay, tusaale ahaan, midabka warqadda, qaabkeeda, iyo kuwani waa qaybaha muhiimka ah ee dukumentiyada taariikhiga ah.

Si loo xalliyo dhibaatooyinkan, AT&T waxay horumarisay DjVu. Waxay suurtogal ka dhigtay in la isku cadaadiyo dukumentiyada midabka la sawiray oo leh 300 dpi ilaa 40-60 KB, oo leh cabbir asalka ah 25 MB. DjVu waxay hoos u dhigtay cabbirka bogagga madow iyo caddaanka ilaa 10-30 KB.

Sida DjVu u cadaadiyo dukumentiyada

DjVu waxay la shaqayn kartaa labada dukumeenti waraaqeed ee la sawiray iyo qaabab kale oo dhijitaal ah, sida PDF. Sida uu u shaqeeyo DjVu been tignoolajiyada sawirka u kala qaybisa saddex qaybood: hore, asalka iyo maaskaro madow iyo caddaan (bit).

Maaskarada waxaa lagu keydiyaa xallinta faylka asalka ah iyo waxaa ku jira sawirka qoraalka iyo tafaasiil kale oo cad - xariiqyo fiican iyo jaantusyo - iyo sidoo kale sawirro isbarbar dhigaya.

Waxay leedahay xallinta 300 dpi si ay u ilaaliso khadadka wanaagsan iyo xarafku fiiqan yihiin, waxaana lagu cuudeeyaa iyadoo la isticmaalayo JB2 algorithm, taas oo ah kala duwanaanshaha AT&T's JBIG2 algorithm ee fakiska. Muuqaalka JB2 Waa waxa ay qabato waa in ay raadiso jilayaasha nuqul ka mid ah bogga oo ay kaydiso sawirkooda hal mar oo keliya. Haddaba, dukumeenti bogag badan ka kooban, dhowr bog oo isku xigta waxay wadaagaan "qaamuus" caadi ah.

Dhabarku waxa uu ka kooban yahay qaabka bogga iyo sawirada, xalintiisuna way ka hoosaysaa kan maaskarada. Sooyaalka aan khasaaraha lahayn waxa lagu kaydiyaa 100 dpi.

Hordhac dukaamada macluumaadka midabka ee ku saabsan maaskarada, iyo xalintiisa inta badan waa la dhimay xitaa intaa ka sii badan, sababtoo ah inta badan midabka qoraalku waa madow oo isku mid ah hal dabeecad daabacan. Loo isticmaalo in lagu cadaadiyo xagga hore iyo asalka cadaadiska mawjada.

Marxaladda ugu dambeysa ee abuurista dukumeentiga DjVu waa entropy encoding, marka xisaabiyaha la-qabsiga ee codeeyaha uu u beddelo taxane xarfo isku mid ah oo u beddelo qiime laba-geesood ah.

Faa'iidooyinka qaabka

DjVu hawshiisu waxay ahayd badbaadi "hantida" dukumeenti warqad ah oo qaab digital ah, taas oo u oggolaanaysa xitaa kombiyuutarada daciifka ah inay la shaqeeyaan dukumeentiyadaas. Sidaa darteed, software-ka loogu talagalay daawashada faylasha DjVu waxay awood u leedahay inay "dhakhso u bandhigto". Waad ku mahadsan tahay iyada xusuusta rarista kaliya qaybtaas bogga DjVu ee ay tahay in lagu soo bandhigo shaashadda.

Tani waxay sidoo kale suurtogal ka dhigaysaa in la eego faylasha "aan la soo dejin", taas oo ah, bogag gaar ah oo ka kooban dukumeenti DjVu ee bogag badan. Xaaladdan oo kale, sawir horumarsan ee faahfaahinta sawirka ayaa la isticmaalaa, marka qaybaha ay u muuqdaan inay "muuqdaan" sida faylka loo soo dejiyo (sida JPEG).

20 sano ka hor, markii qaabkan la soo bandhigay, bogga waxaa lagu shubay saddex marxaladood: marka hore qaybta qoraalka ayaa la raray, dhowr ilbiriqsi ka dib waxaa la raray nuqulkii ugu horreeyay ee sawirada iyo asalka. Ka dib, dhammaan bogga buuggu "wuxuu soo muuqday."

Joogitaanka qaab dhismeed saddex heer ah ayaa sidoo kale kuu ogolaanaya inaad ka raadiso buugaagta la sawiray (maadaama uu jiro lakab qoraal gaar ah). Tani waxay soo baxday inay ku habboon tahay marka la shaqeynayo suugaanta farsamada iyo buugaagta tixraaca, sidaas darteed DjVu waxay saldhig u noqotay dhowr maktabadood oo buugaag cilmi ah. Tusaale ahaan, 2002 ayaa la doortay Kaydka Internetka sida mid ka mid ah qaababka (oo ay la socdaan TIFF iyo PDF) ee mashruuca lagu ilaalinayo buugaagta la sawiray ee ilaha furan.

Khasaaraha qaabka

Si kastaba ha ahaatee, sida dhammaan tignoolajiyada, DjVu waxay leedahay cilladaheeda. Tusaale ahaan, marka sawirka buugaagta lagu dhejiyo qaabka DjVu, jilayaasha qaar ee dukumeentiga waxaa lagu bedeli karaa kuwa kale oo muuqaal ahaan la mid ah. Tani waxay badanaa ku dhacdaa xarfaha "i" iyo "n", taas oo ah sababta dhibaatadan helay Magaca "dhibaatadayin". Kuma xirna luqadda qoraalka oo waxay saameysaa, waxyaabo kale, tirooyinka iyo jilayaasha kale ee yaryar ee soo noqnoqda.

Sababteedu waa khaladaad kala soocida jilayaasha ku jira koodka JB2. Waxay "kala qaybisaa" u kala qaadaa kooxo 10-20 qaybood ah waxayna samaysaa qaamuus calaamado guud ah koox kasta. Qaamuusku waxa uu ka kooban yahay tusaalayaal xarfo iyo tirooyin caadi ah oo leh bogag iyo iskuduwayaasha muuqaalkooda. Markaad aragto buug DjVu, jilayaasha qaamuuska ayaa la geliyaa meelaha saxda ah.

Tani waxay kuu ogolaaneysaa inaad hoos u dhigto xajmiga faylka DjVu, si kastaba ha ahaatee, haddii bandhigyada laba xaraf ay muuqaal ahaan isku mid yihiin, encoder-ku wuu ku wareerin karaa ama ku qaldami karaa isku mid. Mararka qaarkood tani waxay keentaa dhaawac ku yimaada qaacidooyinka dukumeenti farsamo. Si loo xalliyo dhibaatadan, waxaad ka tagi kartaa algorithms-ka cadaadiska, laakiin tani waxay kordhin doontaa cabbirka nuqulka dhijitaalka ah ee buugga.

Khasaaraha kale ee qaabkani leeyahay ayaa ah in aanu si caadi ah u taageerin nidaamyada hawlgalka casriga ah ee badan (ay ku jiraan kuwa mobilada). Sidaa darteed, si aad ula shaqeyso waxaad u baahan tahay inaad ku rakibto dhinac saddexaad barnaamijyada, sida DjVuReader, WinDjView, Evince, iwm. Si kastaba ha ahaatee, halkan waxaan jeclaan lahaa in aan ogaado in qaar ka mid ah akhristayaasha elektaroonigga ah (tusaale, ONYX BOOX) ay taageeraan qaabka DjVu "ka baxsan sanduuqa" - maadaama codsiyada lagama maarmaanka ah ay horayba halkaas ugu rakibeen.

Jid ahaan, waxaan ka hadalnay waxa kale ee codsiyada akhristayaasha ku saleysan Android ay ku sameyn karaan mid ka mid ah kuwii hore qalabka.

E-buugaagta iyo qaababkooda: DjVu - taariikhdeeda, faa'iidooyinka, khasaaraha iyo sifooyinka
Akhriste ONYX BOOX Chronos

Dhibaato qaab kale ayaa u muuqata marka la shaqeynayo dukumiintiyada DjVu ee shaashadaha yaryar ee qalabka moobiilka - casriga, kiniiniyada, akhristayaasha. Mararka qaarkood faylasha DjVu waxaa lagu soo bandhigaa qaab sawir ah oo buug lagu faafiyo, suugaanta xirfadda leh iyo dukumeentiyada shaqada ayaa inta badan ku jira qaabka A4, markaa waa inaad "dhaqaaqdaa" sawirka raadinta macluumaadka.

Si kastaba ha ahaatee, waxaan ognahay in dhibaatadan sidoo kale la xallin karo. Habka ugu fudud, dabcan, waa in la raadiyo dukumeenti qaab kale duwan - laakiin haddii doorashadani aysan suurtagal ahayn (tusaale ahaan, waxaad u baahan tahay inaad la shaqeyso tiro badan oo suugaanta farsamada ah ee DjVu), markaa waxaad isticmaali kartaa akhristayaasha elektaroonigga ah. oo leh xajmi weyn oo ka bilaabma 9,7 ilaa 13,3 inji, kaas oo si gaar ah “loogu talagalay” la shaqaynta dukumentiyadan.

Tusaale ahaan, khadka ONYX BOOX aaladaha noocaan ah waa Chronos и MAX 2 (sida jidka ag fadhida, waxaanu diyaarinay dib u eegis ku saabsan qaabkan akhristaha ah, waxaanu dhawaan ku daabici doonaa blog-keena), iyo sidoo kale note, Kaas oo leh shaashad E Ink Mobius Carta oo leh xajmi dhan 10,3 inch iyo xalin kordhay. Qalabka noocan oo kale ah ayaa kuu oggolaanaya inaad si degan u baarto dhammaan faahfaahinta sawirada cabbirkooda asalka ah waxayna ku habboon yihiin kuwa inta badan akhriya suugaanta waxbarashada ama farsamada. Si aad u aragto faylasha DjVu iyo PDF waxaa loo isticmaalaa Akhristaha NEO, kaas oo kuu ogolaanaya inaad hagaajiso isbarbardhigga iyo dhumucda xarfaha digitized.

In kasta oo qaabku cilladaysan yahay, maanta DjVu waa mid ka mid ah qaababka ugu caansan ee "ilaalinta" shaqooyinka suugaanta. Tani waxay inta badan sabab u tahay xaqiiqda ah in uu Waa furan, iyo qaar ka mid ah xaddidaadaha tignoolajiyada maanta ayaa u oggolaanaya tignoolajiyada casriga ah iyo horumarka inay ka gudbaan.

Qalabka soo socda waxaan sii wadi doonaa sheekada ku saabsan taariikhda soo ifbaxa qaababka e-books iyo sifooyinka shaqadooda.

PS Dhowr qaybood oo akhristayaasha ONYX BOOX:



Source: www.habr.com

Add a comment