ඊ-පොත් සහ ඒවායේ ආකෘති: DjVu - එහි ඉතිහාසය, වාසි, අවාසි සහ විශේෂාංග

70 දශකයේ මුල් භාගයේදී ඇමරිකානු ලේඛක මයිකල් හාර්ට් කළමනාකරණය කළේය ලබා ගැනීමට ඉලිනොයිස් විශ්ව විද්‍යාලයේ ස්ථාපනය කර ඇති Xerox Sigma 5 පරිගණකයකට අසීමිත ප්‍රවේශය. යන්ත්‍රයේ සම්පත් හොඳින් ප්‍රයෝජනයට ගැනීම සඳහා ඔහු එක්සත් ජනපදයේ නිදහස් ප්‍රකාශය නැවත මුද්‍රණය කරමින් පළමු විද්‍යුත් පොත නිර්මාණය කිරීමට තීරණය කළේය.

අද, ඩිජිටල් සාහිත්‍යය පුළුල් ලෙස ව්‍යාප්ත වී ඇති අතර, බොහෝ දුරට අතේ ගෙන යා හැකි උපාංග (ස්මාර්ට්ෆෝන්, ඊ-කියවන්නන්, ලැප්ටොප්) සංවර්ධනයට ස්තූතිවන්ත වේ. මෙය විද්‍යුත් පොත් ආකෘති විශාල සංඛ්‍යාවක් බිහිවීමට හේතු වී ඇත. ඔවුන්ගේ විශේෂාංග තේරුම් ගැනීමට සහ ඔවුන්ගෙන් වඩාත් ජනප්රිය ඉතිහාසය කියන්නට උත්සාහ කරමු - අපි DjVu ආකෘතියෙන් පටන් ගනිමු.

ඊ-පොත් සහ ඒවායේ ආකෘති: DjVu - එහි ඉතිහාසය, වාසි, අවාසි සහ විශේෂාංග
/flickr/ ලේන් පියර්මන් / CC

ආකෘතියේ මතුවීම

DjVu 1996 දී AT&T Labs විසින් සංවර්ධනය කරන ලද්දේ එක් අරමුණක් ඇතිවය - වෙබ් සංවර්ධකයින්ට අන්තර්ජාලය හරහා අධි-විභේදන රූප බෙදා හැරීම සඳහා මෙවලමක් ලබා දීම සඳහා ය.

කාරණය නම් ඒ වන විට සියලුම තොරතුරු වලින් 90% ක් තවමත් පවතී ගබඩා කරන ලදී කඩදාසි මත, සහ වැදගත් ලේඛන බොහොමයක වර්ණ රූප සහ ඡායාරූප තිබුණි. පාඨයේ කියවීමේ හැකියාව සහ පින්තූරවල ගුණාත්මකභාවය පවත්වා ගැනීම සඳහා, අධි-විභේදන ස්කෑන් කිරීම අවශ්ය විය.

සම්භාව්‍ය වෙබ් ආකෘති - JPEG, GIF සහ PNG - එවැනි රූප සමඟ වැඩ කිරීමට හැකි විය, නමුත් පරිමාවේ පිරිවැය අනුව. JPEG නඩුවේදී, එම නිසා පෙළ කියවන ලදී මොනිටරයේ තිරය මත, මට 300 dpi විභේදනයකින් ලේඛනය පරිලෝකනය කිරීමට සිදු විය. සඟරාවේ වර්ණ පිටුවක් 500 KB පමණ අල්ලාගෙන ඇත. මේ ප්‍රමාණයේ ලිපිගොනු අන්තර්ජාලයෙන් බාගත කිරීම එකල සෑහෙන ශ්‍රම වැය ක්‍රියාවලියක් විය.

විකල්පය වූයේ OCR තාක්ෂණයන් භාවිතයෙන් කඩදාසි ලේඛන ඩිජිටල්කරණය කිරීමයි, නමුත් වසර 20 කට පෙර ඒවායේ නිරවද්‍යතාවය පරමාදර්ශී නොවීය - සැකසීමෙන් පසු, අවසාන ප්‍රති result ලය අතින් බැරෑරුම් ලෙස සංස්කරණය කිරීමට සිදු විය. ඒ අතරම, ග්‍රැෆික්ස් සහ රූප "ඉහළින්" පැවතුනි. ස්කෑන් කරන ලද රූපයක් පෙළ ලේඛනයකට කාවැද්දීමට හැකි වුවද, සමහර දෘශ්‍ය තොරතුරු නැති වී ඇත, උදාහරණයක් ලෙස, කඩදාසි වල වර්ණය, එහි වයනය සහ මේවා ඓතිහාසික ලේඛනවල වැදගත් අංග වේ.

මෙම ගැටළු විසඳීම සඳහා AT&T විසින් DjVu සංවර්ධනය කරන ලදී. 300 MB මුල් ප්‍රමාණයෙන් 40 dpi සිට 60-25 KB දක්වා විභේදනයකින් ස්කෑන් කරන ලද වර්ණ ලේඛන සම්පීඩනය කිරීමට එය හැකි විය. DjVu කළු සහ සුදු පිටු වල ප්‍රමාණය 10-30 KB දක්වා අඩු කළේය.

DjVu ලේඛන සම්පීඩනය කරන ආකාරය

DjVu ස්කෑන් කරන ලද කඩදාසි ලේඛන සහ PDF වැනි අනෙකුත් ඩිජිටල් ආකෘති සමඟ වැඩ කළ හැක. DjVu ක්‍රියා කරන ආකාරය බොරුයි රූපය කොටස් තුනකට බෙදන තාක්ෂණය: පෙරබිම, පසුබිම සහ කළු සහ සුදු (බිට්) වෙස් මුහුණ.

මුල් ගොනුවේ විභේදනය මත වෙස්මුහුණ සුරකිනු ලැබේ අඩංගු වේ පෙළ සහ අනෙකුත් පැහැදිලි විස්තර - සියුම් රේඛා සහ රූප සටහන් - මෙන්ම එකිනෙකට වෙනස් පින්තූර.

එය සියුම් රේඛා සහ අකුරු දළ සටහන් තියුණුව තබා ගැනීමට 300 dpi ක විභේදනයක් ඇති අතර, ෆැක්ස් කිරීම සඳහා AT&T හි JBIG2 ඇල්ගොරිතමයේ ප්‍රභේදයක් වන JB2 ඇල්ගොරිතම භාවිතයෙන් සම්පීඩිත වේ. JB2 හි විශේෂාංගය එය එය කරන්නේ එය පිටුවේ අනුපිටපත් අක්ෂර සොයන අතර ඔවුන්ගේ රූපය එක් වරක් පමණක් සුරැකීමයි. මේ අනුව, බහු-පිටු ලේඛනවල, සෑම අඛණ්ඩ පිටු කිහිපයක්ම පොදු "ශබ්දකෝෂයක්" බෙදා ගනී.

පසුබිමෙහි පිටුවේ වයනය සහ නිදර්ශන අඩංගු වන අතර එහි විභේදනය වෙස් මුහුණට වඩා අඩුය. පාඩු රහිත පසුබිම 100 dpi හි සුරකිනු ලැබේ.

පෙරබිම තබා ගනී වෙස්මුහුණ පිළිබඳ වර්ණ තොරතුරු, සහ එහි විභේදනය සාමාන්‍යයෙන් තවත් අඩු වේ, මන්ද බොහෝ අවස්ථාවලදී පෙළ වර්ණය කළු වන අතර එක් මුද්‍රිත අක්ෂරයකට සමාන වේ. පෙරබිම සහ පසුබිම සම්පීඩනය කිරීමට භාවිතා කරයි තරංග සම්පීඩනය.

DjVu ලේඛනයක් නිර්මාණය කිරීමේ අවසාන අදියර වන්නේ එන්ට්‍රොපි කේතීකරණයයි, අනුවර්තිත අංක ගණිත කේතකයක් සමාන අක්ෂරවල අනුපිළිවෙල ද්විමය අගයක් බවට පත් කරන විට.

ආකෘතියේ වාසි

DjVu ගේ කාර්යය විය ඉතිරිකර ගන්න ඩිජිටල් ආකාරයෙන් කඩදාසි ලේඛනයක "ගුණාංග", දුර්වල පරිගණක පවා එවැනි ලේඛන සමඟ වැඩ කිරීමට ඉඩ සලසයි. එබැවින්, DjVu ගොනු බැලීම සඳහා මෘදුකාංගය "වේගවත් විදැහුම්කරණය" කිරීමේ හැකියාව ඇත. මතකයේ දී ඇයට ස්තූතියි පැටවීම තිරයේ පෙන්විය යුතු DjVu පිටුවේ එම කොටස පමණි.

මෙය “බාගත නොකළ” ගොනු, එනම් බහු පිටු DjVu ලේඛනයක තනි පිටු බැලීමට ද හැකි වේ. මෙම අවස්ථාවෙහිදී, ගොනුව බාගත කරන විට සංරචක "පෙනෙන" බව පෙනෙන විට (JPEG හි මෙන්) රූප විස්තර ප්‍රගතිශීලී ඇඳීම භාවිතා කරනු ලැබේ.

මීට වසර 20 කට පෙර, මෙම ආකෘතිය හඳුන්වා දුන් විට, පිටුව අදියර තුනකින් පටවා ඇත: පළමුව පෙළ සංරචකය පූරණය කරන ලදී, තත්පර කිහිපයකට පසු රූපවල පළමු අනුවාද සහ පසුබිම පූරණය විය. පසුව, පොතේ මුළු පිටුවම "පෙනිණ."

තුන් මට්ටමේ ව්‍යුහයක් තිබීම ඔබට ස්කෑන් කරන ලද පොත් හරහා සෙවීමට ද ඉඩ සලසයි (විශේෂ පෙළ ස්ථරයක් ඇති බැවින්). තාක්ෂණික සාහිත්‍ය සහ විමර්ශන පොත් සමඟ වැඩ කිරීමේදී මෙය පහසු විය, එබැවින් DjVu විද්‍යාත්මක පොත් පුස්තකාල කිහිපයකට පදනම විය. නිදසුනක් වශයෙන්, 2002 දී ඔහු තෝරා ගන්නා ලදී අන්තර්ජාල ලේඛනාගාරය විවෘත මූලාශ්‍රවලින් ස්කෑන් කරන ලද පොත් සංරක්ෂණය කිරීමේ ව්‍යාපෘතියක් සඳහා (TIFF සහ PDF සමඟ) එක් ආකෘතියක් ලෙස.

ආකෘතියේ අවාසි

කෙසේ වෙතත්, සියලුම තාක්ෂණයන් මෙන්, DjVu හි අඩුපාඩු තිබේ. උදාහරණයක් ලෙස, පොත් ස්කෑන් කිරීම DjVu ආකෘතියට කේතනය කරන විට, ලේඛනයේ ඇති සමහර අක්ෂර පෙනුමෙන් සමාන අනෙක් ඒවා මගින් ප්‍රතිස්ථාපනය විය හැක. මෙය බොහෝ විට සිදු වන්නේ "i" සහ "n" යන අකුරු සමඟය, මෙම ගැටළුව වන්නේ එබැවිනි ලැබුණි නම "යින් ගැටලුව". එය පෙළෙහි භාෂාව මත රඳා නොපවතින අතර වෙනත් දේ අතර අංක සහ අනෙකුත් කුඩා පුනරාවර්තන අක්ෂරවලට බලපායි.

එහි හේතුව JB2 කේතකය තුළ අක්ෂර වර්ගීකරණ දෝෂ වේ. එය කෑලි 10-20 ක කණ්ඩායම් වලට ස්කෑන් "බෙදී" සහ එක් එක් කණ්ඩායම සඳහා පොදු සංකේත ශබ්දකෝෂයක් සාදයි. ශබ්දකෝෂයේ පිටු සහ ඒවායේ පෙනුමේ ඛණ්ඩාංක සහිත පොදු අකුරු සහ අංක සඳහා උදාහරණ අඩංගු වේ. ඔබ DjVu පොතක් නරඹන විට, ශබ්දකෝෂයේ අක්ෂර නිවැරදි ස්ථානවලට ඇතුල් කරනු ලැබේ.

මෙය ඔබට DjVu ගොනුවේ ප්‍රමාණය අඩු කිරීමට ඉඩ සලසයි, කෙසේ වෙතත්, අකුරු දෙකක සංදර්ශක දෘශ්‍යමය වශයෙන් සමාන නම්, කේතකය විසින් ඒවා ව්‍යාකූල කළ හැකිය, නැතහොත් ඒවා වැරදි ලෙස වරදවා වටහා ගත හැකිය. සමහර විට මෙය තාක්ෂණික ලියවිල්ලක සූත්ර වලට හානි කිරීමට හේතු වේ. මෙම ගැටළුව විසඳීම සඳහා, ඔබට සම්පීඩන ඇල්ගොරිතම අත්හැරිය හැකිය, නමුත් මෙය පොතේ ඩිජිටල් පිටපතේ ප්රමාණය වැඩි කරයි.

ආකෘතියේ තවත් අවාසියක් නම් එය බොහෝ නවීන මෙහෙයුම් පද්ධතිවල (ජංගම ඒවා ඇතුළුව) පෙරනිමියෙන් සහාය නොදක්වයි. එබැවින්, එය සමඟ වැඩ කිරීමට ඔබ තෙවන පාර්ශවයක් ස්ථාපනය කළ යුතුය වැඩසටහන්, DjVuReader, WinDjView, Evince, යනාදිය. කෙසේ වෙතත්, මෙහිදී මම සමහර විද්‍යුත් පාඨකයින් (උදාහරණයක් ලෙස, ONYX BOOX) DjVu ආකෘතියට "පෙට්ටියෙන් පිටත" සහාය දක්වන බව සටහන් කිරීමට කැමැත්තෙමි - අවශ්‍ය යෙදුම් දැනටමත් එහි ස්ථාපනය කර ඇති බැවින්.

මාර්ගය වන විට, අපි ඇන්ඩ්රොයිඩ් මත පදනම් වූ පාඨකයින් සඳහා වෙන යෙදුම් වලට පෙර එකකින් කළ හැකි දේ ගැන කතා කළෙමු ද්රව්ය.

ඊ-පොත් සහ ඒවායේ ආකෘති: DjVu - එහි ඉතිහාසය, වාසි, අවාසි සහ විශේෂාංග
පාඨකයා ONYX BOOX Chronos

ජංගම උපාංගවල කුඩා තිරවල DjVu ලේඛන සමඟ වැඩ කරන විට තවත් ආකෘති ගැටළුවක් දිස්වේ - ස්මාර්ට් ෆෝන්, ටැබ්ලට්, පාඨකයන්. සමහර විට DjVu ලිපිගොනු පොත් පැතිරීමක ස්කෑන් ආකාරයෙන් ඉදිරිපත් කර ඇති අතර වෘත්තීය සාහිත්‍යය සහ වැඩ කරන ලියකියවිලි බොහෝ විට A4 ආකෘතියෙන් ඇත, එබැවින් ඔබට තොරතුරු සෙවීමේදී රූපය “චලනය” කළ යුතුය.

කෙසේ වෙතත්, මෙම ගැටළුව ද විසඳිය හැකි බව අපි සටහන් කරමු. ඇත්ත වශයෙන්ම පහසුම ක්‍රමය නම් වෙනත් ආකෘතියකින් ලේඛනයක් සෙවීමයි - නමුත් මෙම විකල්පය කළ නොහැකි නම් (උදාහරණයක් ලෙස, ඔබට DjVu හි තාක්ෂණික සාහිත්‍ය විශාල ප්‍රමාණයක් සමඟ වැඩ කිරීමට අවශ්‍ය නම්), එවිට ඔබට විද්‍යුත් පාඨකයන් භාවිතා කළ හැකිය. අඟල් 9,7 සිට 13,3 දක්වා විශාල විකර්ණයක් සහිතව, එවැනි ලේඛන සමඟ වැඩ කිරීම සඳහා විශේෂයෙන් "අනුරූප" කර ඇත.

උදාහරණයක් ලෙස, ONYX BOOX රේඛාවේ එවැනි උපාංග වේ වර්ණදේහ и MAX 2 (මාර්ගය වන විට, අපි මෙම පාඨක ආකෘතිය පිළිබඳ සමාලෝචනයක් සකස් කර ඇති අතර, එය ඉක්මනින් අපගේ බ්ලොග් අඩවියේ පළ කරනු ඇත), සහ ද සටහන, අඟල් 10,3 ක විකර්ණයක් සහ වැඩි විභේදනයක් සහිත E Ink Mobius Carta තිරයක් ඇත. එවැනි උපකරණ මඟින් නිදර්ශනවල සියලු විස්තර ඔවුන්ගේ මුල් ප්‍රමාණයෙන් සන්සුන්ව පරීක්ෂා කිරීමට ඔබට ඉඩ සලසයි, බොහෝ විට අධ්‍යාපනික හෝ තාක්ෂණික සාහිත්‍ය කියවීමට ඇති අය සඳහා සුදුසු වේ. DjVu සහ PDF ගොනු බැලීම සඳහා භාවිතා වේ NEO Reader, ඩිජිටල් කළ අකුරුවල වෙනස සහ ඝනකම සකස් කිරීමට ඔබට ඉඩ සලසයි.

ආකෘතියේ අඩුපාඩු තිබියදීත්, අද වන විට DjVu සාහිත්‍ය කෘති "සංරක්‍ෂණය" සඳහා වඩාත් ජනප්‍රිය ආකෘතියක් ලෙස පවතී. මෙය බොහෝ දුරට හේතු වී ඇත්තේ ඔහු ය එය විවෘත, සහ අද සමහර තාක්ෂණික සීමාවන් නවීන තාක්ෂණයන් සහ වර්ධනයන් මග හැරීමට ඉඩ සලසයි.

පහත සඳහන් ද්‍රව්‍යවල අපි විද්‍යුත් පොත් ආකෘති මතුවීමේ ඉතිහාසය සහ ඔවුන්ගේ කාර්යයේ ලක්ෂණ පිළිබඳ කතාව දිගටම කරගෙන යන්නෙමු.

PS ONYX BOOX පාඨක කට්ටල කිහිපයක්:



මූලාශ්රය: www.habr.com

අදහස් එක් කරන්න