70 දශකයේ මුල් භාගයේදී ඇමරිකානු ලේඛක මයිකල් හාර්ට් කළමනාකරණය කළේය
අද, ඩිජිටල් සාහිත්යය පුළුල් ලෙස ව්යාප්ත වී ඇති අතර, බොහෝ දුරට අතේ ගෙන යා හැකි උපාංග (ස්මාර්ට්ෆෝන්, ඊ-කියවන්නන්, ලැප්ටොප්) සංවර්ධනයට ස්තූතිවන්ත වේ. මෙය විද්යුත් පොත් ආකෘති විශාල සංඛ්යාවක් බිහිවීමට හේතු වී ඇත. ඔවුන්ගේ විශේෂාංග තේරුම් ගැනීමට සහ ඔවුන්ගෙන් වඩාත් ජනප්රිය ඉතිහාසය කියන්නට උත්සාහ කරමු - අපි DjVu ආකෘතියෙන් පටන් ගනිමු.
/flickr/
ආකෘතියේ මතුවීම
DjVu 1996 දී AT&T Labs විසින් සංවර්ධනය කරන ලද්දේ එක් අරමුණක් ඇතිවය - වෙබ් සංවර්ධකයින්ට අන්තර්ජාලය හරහා අධි-විභේදන රූප බෙදා හැරීම සඳහා මෙවලමක් ලබා දීම සඳහා ය.
කාරණය නම් ඒ වන විට සියලුම තොරතුරු වලින් 90% ක් තවමත් පවතී
සම්භාව්ය වෙබ් ආකෘති - JPEG, GIF සහ PNG - එවැනි රූප සමඟ වැඩ කිරීමට හැකි විය, නමුත් පරිමාවේ පිරිවැය අනුව. JPEG නඩුවේදී, එම නිසා පෙළ
විකල්පය වූයේ OCR තාක්ෂණයන් භාවිතයෙන් කඩදාසි ලේඛන ඩිජිටල්කරණය කිරීමයි, නමුත් වසර 20 කට පෙර ඒවායේ නිරවද්යතාවය පරමාදර්ශී නොවීය - සැකසීමෙන් පසු, අවසාන ප්රති result ලය අතින් බැරෑරුම් ලෙස සංස්කරණය කිරීමට සිදු විය. ඒ අතරම, ග්රැෆික්ස් සහ රූප "ඉහළින්" පැවතුනි. ස්කෑන් කරන ලද රූපයක් පෙළ ලේඛනයකට කාවැද්දීමට හැකි වුවද, සමහර දෘශ්ය තොරතුරු නැති වී ඇත, උදාහරණයක් ලෙස, කඩදාසි වල වර්ණය, එහි වයනය සහ මේවා ඓතිහාසික ලේඛනවල වැදගත් අංග වේ.
මෙම ගැටළු විසඳීම සඳහා AT&T විසින් DjVu සංවර්ධනය කරන ලදී. 300 MB මුල් ප්රමාණයෙන් 40 dpi සිට 60-25 KB දක්වා විභේදනයකින් ස්කෑන් කරන ලද වර්ණ ලේඛන සම්පීඩනය කිරීමට එය හැකි විය. DjVu කළු සහ සුදු පිටු වල ප්රමාණය 10-30 KB දක්වා අඩු කළේය.
DjVu ලේඛන සම්පීඩනය කරන ආකාරය
DjVu ස්කෑන් කරන ලද කඩදාසි ලේඛන සහ PDF වැනි අනෙකුත් ඩිජිටල් ආකෘති සමඟ වැඩ කළ හැක. DjVu ක්රියා කරන ආකාරය
මුල් ගොනුවේ විභේදනය මත වෙස්මුහුණ සුරකිනු ලැබේ
එය සියුම් රේඛා සහ අකුරු දළ සටහන් තියුණුව තබා ගැනීමට 300 dpi ක විභේදනයක් ඇති අතර, ෆැක්ස් කිරීම සඳහා AT&T හි JBIG2 ඇල්ගොරිතමයේ ප්රභේදයක් වන JB2 ඇල්ගොරිතම භාවිතයෙන් සම්පීඩිත වේ. JB2 හි විශේෂාංගය
පසුබිමෙහි පිටුවේ වයනය සහ නිදර්ශන අඩංගු වන අතර එහි විභේදනය වෙස් මුහුණට වඩා අඩුය. පාඩු රහිත පසුබිම 100 dpi හි සුරකිනු ලැබේ.
පෙරබිම
DjVu ලේඛනයක් නිර්මාණය කිරීමේ අවසාන අදියර වන්නේ එන්ට්රොපි කේතීකරණයයි, අනුවර්තිත අංක ගණිත කේතකයක් සමාන අක්ෂරවල අනුපිළිවෙල ද්විමය අගයක් බවට පත් කරන විට.
ආකෘතියේ වාසි
DjVu ගේ කාර්යය විය
මෙය “බාගත නොකළ” ගොනු, එනම් බහු පිටු DjVu ලේඛනයක තනි පිටු බැලීමට ද හැකි වේ. මෙම අවස්ථාවෙහිදී, ගොනුව බාගත කරන විට සංරචක "පෙනෙන" බව පෙනෙන විට (JPEG හි මෙන්) රූප විස්තර ප්රගතිශීලී ඇඳීම භාවිතා කරනු ලැබේ.
මීට වසර 20 කට පෙර, මෙම ආකෘතිය හඳුන්වා දුන් විට, පිටුව අදියර තුනකින් පටවා ඇත: පළමුව පෙළ සංරචකය පූරණය කරන ලදී, තත්පර කිහිපයකට පසු රූපවල පළමු අනුවාද සහ පසුබිම පූරණය විය. පසුව, පොතේ මුළු පිටුවම "පෙනිණ."
තුන් මට්ටමේ ව්යුහයක් තිබීම ඔබට ස්කෑන් කරන ලද පොත් හරහා සෙවීමට ද ඉඩ සලසයි (විශේෂ පෙළ ස්ථරයක් ඇති බැවින්). තාක්ෂණික සාහිත්ය සහ විමර්ශන පොත් සමඟ වැඩ කිරීමේදී මෙය පහසු විය, එබැවින් DjVu විද්යාත්මක පොත් පුස්තකාල කිහිපයකට පදනම විය. නිදසුනක් වශයෙන්, 2002 දී ඔහු තෝරා ගන්නා ලදී
ආකෘතියේ අවාසි
කෙසේ වෙතත්, සියලුම තාක්ෂණයන් මෙන්, DjVu හි අඩුපාඩු තිබේ. උදාහරණයක් ලෙස, පොත් ස්කෑන් කිරීම DjVu ආකෘතියට කේතනය කරන විට, ලේඛනයේ ඇති සමහර අක්ෂර පෙනුමෙන් සමාන අනෙක් ඒවා මගින් ප්රතිස්ථාපනය විය හැක. මෙය බොහෝ විට සිදු වන්නේ "i" සහ "n" යන අකුරු සමඟය, මෙම ගැටළුව වන්නේ එබැවිනි
එහි හේතුව JB2 කේතකය තුළ අක්ෂර වර්ගීකරණ දෝෂ වේ. එය කෑලි 10-20 ක කණ්ඩායම් වලට ස්කෑන් "බෙදී" සහ එක් එක් කණ්ඩායම සඳහා පොදු සංකේත ශබ්දකෝෂයක් සාදයි. ශබ්දකෝෂයේ පිටු සහ ඒවායේ පෙනුමේ ඛණ්ඩාංක සහිත පොදු අකුරු සහ අංක සඳහා උදාහරණ අඩංගු වේ. ඔබ DjVu පොතක් නරඹන විට, ශබ්දකෝෂයේ අක්ෂර නිවැරදි ස්ථානවලට ඇතුල් කරනු ලැබේ.
මෙය ඔබට DjVu ගොනුවේ ප්රමාණය අඩු කිරීමට ඉඩ සලසයි, කෙසේ වෙතත්, අකුරු දෙකක සංදර්ශක දෘශ්යමය වශයෙන් සමාන නම්, කේතකය විසින් ඒවා ව්යාකූල කළ හැකිය, නැතහොත් ඒවා වැරදි ලෙස වරදවා වටහා ගත හැකිය. සමහර විට මෙය තාක්ෂණික ලියවිල්ලක සූත්ර වලට හානි කිරීමට හේතු වේ. මෙම ගැටළුව විසඳීම සඳහා, ඔබට සම්පීඩන ඇල්ගොරිතම අත්හැරිය හැකිය, නමුත් මෙය පොතේ ඩිජිටල් පිටපතේ ප්රමාණය වැඩි කරයි.
ආකෘතියේ තවත් අවාසියක් නම් එය බොහෝ නවීන මෙහෙයුම් පද්ධතිවල (ජංගම ඒවා ඇතුළුව) පෙරනිමියෙන් සහාය නොදක්වයි. එබැවින්, එය සමඟ වැඩ කිරීමට ඔබ තෙවන පාර්ශවයක් ස්ථාපනය කළ යුතුය
මාර්ගය වන විට, අපි ඇන්ඩ්රොයිඩ් මත පදනම් වූ පාඨකයින් සඳහා වෙන යෙදුම් වලට පෙර එකකින් කළ හැකි දේ ගැන කතා කළෙමු
පාඨකයා
ජංගම උපාංගවල කුඩා තිරවල DjVu ලේඛන සමඟ වැඩ කරන විට තවත් ආකෘති ගැටළුවක් දිස්වේ - ස්මාර්ට් ෆෝන්, ටැබ්ලට්, පාඨකයන්. සමහර විට DjVu ලිපිගොනු පොත් පැතිරීමක ස්කෑන් ආකාරයෙන් ඉදිරිපත් කර ඇති අතර වෘත්තීය සාහිත්යය සහ වැඩ කරන ලියකියවිලි බොහෝ විට A4 ආකෘතියෙන් ඇත, එබැවින් ඔබට තොරතුරු සෙවීමේදී රූපය “චලනය” කළ යුතුය.
කෙසේ වෙතත්, මෙම ගැටළුව ද විසඳිය හැකි බව අපි සටහන් කරමු. ඇත්ත වශයෙන්ම පහසුම ක්රමය නම් වෙනත් ආකෘතියකින් ලේඛනයක් සෙවීමයි - නමුත් මෙම විකල්පය කළ නොහැකි නම් (උදාහරණයක් ලෙස, ඔබට DjVu හි තාක්ෂණික සාහිත්ය විශාල ප්රමාණයක් සමඟ වැඩ කිරීමට අවශ්ය නම්), එවිට ඔබට විද්යුත් පාඨකයන් භාවිතා කළ හැකිය. අඟල් 9,7 සිට 13,3 දක්වා විශාල විකර්ණයක් සහිතව, එවැනි ලේඛන සමඟ වැඩ කිරීම සඳහා විශේෂයෙන් "අනුරූප" කර ඇත.
උදාහරණයක් ලෙස, ONYX BOOX රේඛාවේ එවැනි උපාංග වේ
ආකෘතියේ අඩුපාඩු තිබියදීත්, අද වන විට DjVu සාහිත්ය කෘති "සංරක්ෂණය" සඳහා වඩාත් ජනප්රිය ආකෘතියක් ලෙස පවතී. මෙය බොහෝ දුරට හේතු වී ඇත්තේ ඔහු ය
පහත සඳහන් ද්රව්යවල අපි විද්යුත් පොත් ආකෘති මතුවීමේ ඉතිහාසය සහ ඔවුන්ගේ කාර්යයේ ලක්ෂණ පිළිබඳ කතාව දිගටම කරගෙන යන්නෙමු.
PS ONYX BOOX පාඨක කට්ටල කිහිපයක්:
තාක්ෂණයන් එදිරිව “පෞරාණිකත්වය”: ONYX BOOX Chronos රීඩර් සමාලෝචනය රැජින කියවීමට කැමැත්තක් දක්වයි: ONYX BOOX Cleopatra 3 ඊ-පොත සමාලෝචනය ONYX BOOX Darwin 4 හි සමාලෝචනය: E-තීන්ත පිළිබඳ හොඳම විද්යුත් පොත
මූලාශ්රය: www.habr.com