Китобҳои электронӣ ва форматҳои онҳо: DjVu - таърихи он, мусбат, манфи ва хусусиятҳои он

Дар аввали солҳои 70-ум нависандаи амрикоӣ Майкл Ҳарт идора мекард ба даст оред дастрасии номаҳдуд ба компютери Xerox Sigma 5, ки дар Донишгоҳи Иллинойс насб шудааст. Бо максади дуруст истифода бурдани захирахои машина у карор дод, ки аввалин китоби электрониро ба вучуд оварад, ки Декларацияи истиклолияти ШМА-ро аз нав чоп кунад.

Имрӯз адабиёти рақамӣ асосан ба шарофати таҳияи дастгоҳҳои сайёр (смартфонҳо, электронии хонандагон, ноутбукҳо) васеъ паҳн шудааст. Ин ба пайдоиши шумораи зиёди форматҳои китобҳои электронӣ оварда расонд. Биёед кӯшиш кунем, ки хусусиятҳои онҳоро фаҳмем ва таърихи машҳуртарини онҳоро нақл кунем - биёед бо формати DjVu оғоз кунем.

Китобҳои электронӣ ва форматҳои онҳо: DjVu - таърихи он, мусбат, манфи ва хусусиятҳои он
/Flickr/ Лейн Пирман / CC

Пайдоиши формат

DjVu дар соли 1996 аз ҷониби AT&T Labs бо як ҳадаф таҳия шудааст - ба таҳиягарони веб васила барои паҳн кардани тасвирҳои баландсифат дар Интернет.

Гап дар сари он аст, ки дар он вакт 90 фоизи тамоми маълумотхо хануз мавчуданд захира карда шуд руи когаз ва бисьёр хуччатхои мухим расму суратхои ранга доштанд. Барои нигоҳ доштани хониши матн ва сифати тасвирҳо, сканҳои баландсифат лозим буд.

Форматҳои интернетии классикӣ - JPEG, GIF ва PNG - имкон доданд, ки бо чунин тасвирҳо кор кунанд, аммо бо арзиши ҳаҷм. Дар сурати JPEG, ба тавре ки матн хонда шуд дар экрани монитор, ман бояд ҳуҷҷатро бо қарори 300 dpi скан кунам. Саҳифаи рангини маҷалла тақрибан 500 КБ-ро ишғол мекард. Зеркашии файлҳои ин ҳаҷм аз Интернет дар он замон як раванди хеле меҳнатталаб буд.

Варианти алтернативӣ рақамисозии ҳуҷҷатҳои коғазӣ бо истифода аз технологияҳои OCR буд, аммо 20 сол пеш дақиқии онҳо аз идеал дур буд - пас аз коркард, натиҷаи ниҳоӣ бояд бо дасти ҷиддӣ таҳрир карда шавад. Дар айни замон, графика ва тасвирҳо "аз ҳад зиёд" боқӣ монданд. Ва ҳатто агар имкони ворид кардани тасвири сканшуда дар ҳуҷҷати матнӣ вуҷуд дошта бошад ҳам, баъзе ҷузъиёти визуалӣ, масалан, ранги коғаз, матни он гум шуданд ва ин ҷузъҳои муҳими ҳуҷҷатҳои таърихӣ мебошанд.

Барои ҳалли ин мушкилот, AT&T DjVu-ро таҳия кардааст. Он имкон дод, ки ҳуҷҷатҳои рангаи сканшуда бо қарори 300 dpi то 40-60 КБ бо андозаи аслии 25 МБ фишурда шаванд. DjVu андозаи саҳифаҳои сиёҳ ва сафедро то 10-30 KB кам кард.

Чӣ тавр DjVu ҳуҷҷатҳоро фишурда мекунад

DjVu метавонад ҳам бо ҳуҷҷатҳои коғазии сканершуда ва ҳам дигар форматҳои рақамӣ, ба мисли PDF кор кунад. Чӣ тавр DjVu кор мекунад дурӯғ мегӯяд технологияе, ки тасвирро ба се ҷузъ тақсим мекунад: пешина, замина ва ниқоби сиёҳу сафед (бита).

Ниқоб дар ҳалли файли аслӣ нигоҳ дошта мешавад ва дар бар мегирад тасвири матн ва дигар тафсилоти равшан - хатҳои ҷарима ва диаграммаҳо - инчунин расмҳои муқобил.

Он дорои қарори 300 dpi барои нигоҳ доштани хатҳои нозук ва контурҳои ҳарф мебошад ва бо истифода аз алгоритми JB2 фишурда мешавад, ки як варианти алгоритми JBIG2-и AT&T барои факс аст. Хусусияти JB2 Ин аст, он чӣ кор мекунад, он аломатҳои такрориро дар саҳифа ҷустуҷӯ мекунад ва тасвири онҳоро танҳо як маротиба захира мекунад. Ҳамин тариқ, дар ҳуҷҷатҳои бисёрсаҳифа ҳар чанд саҳифаи пайдарпай як “луғат”-и умумӣ доранд.

Замина матни саҳифа ва тасвирҳоро дар бар мегирад ва ҳалли он нисбат ба ниқоб пасттар аст. Заминаи бе талафот дар 100 dpi захира карда мешавад.

Дар пеш нигоҳ медорад маълумоти рангӣ дар бораи ниқоб ва ҳалли он одатан боз ҳам камтар мешавад, зеро дар аксари ҳолатҳо ранги матн сиёҳ аст ва барои як аломати чопшуда яксон аст. Барои фишурдани замина ва замина истифода мешавад фишурдани мавҷ.

Марҳилаи ниҳоии эҷоди ҳуҷҷати DjVu ин рамзгузории энтропия мебошад, вақте ки рамзгузори арифметикии мутобиқшавӣ пайдарпайии аломатҳои якхеларо ба арзиши дуӣ табдил медиҳад.

Афзалиятҳои формат

Вазифаи DjVu буд захира кунед Хусусиятҳои ҳуҷҷати коғазӣ дар шакли рақамӣ, ки ҳатто ба компютерҳои заиф имкон медиҳад, ки бо чунин ҳуҷҷатҳо кор кунанд. Аз ин рӯ, нармафзор барои дидани файлҳои DjVu қобилияти "ба зудӣ намоиш додан" дорад. Ташаккур ба вай дар хотира бор кардан танҳо он пораи саҳифаи DjVu, ки бояд дар экран намоиш дода шавад.

Ин инчунин имкон медиҳад, ки файлҳои "борборшуда", яъне саҳифаҳои алоҳидаи ҳуҷҷати бисёрсаҳифаи DjVu дида шаванд. Дар ин ҳолат, тарҳрезии прогрессивии тафсилоти тасвир истифода мешавад, вақте ки ҷузъҳо ҳангоми зеркашии файл "пайдо мешаванд" (ба мисли JPEG).

20 сол пеш, вақте ки ин формат ҷорӣ шуд, саҳифа дар се марҳила бор карда шуд: аввал ҷузъи матн бор карда шуд, пас аз чанд сония версияҳои аввалини тасвирҳо ва замина бор карда шуданд. Пас аз он, тамоми саҳифаи китоб "пайдо шуд".

Мавҷудияти сохтори сесатҳӣ инчунин ба шумо имкон медиҳад, ки тавассути китобҳои сканшуда ҷустуҷӯ кунед (чун қабати махсуси матн вуҷуд дорад). Ин ҳангоми кор бо адабиёти техникӣ ва маълумотномаҳо қулай буд, аз ин рӯ DjVu асоси якчанд китобхонаҳои китобҳои илмӣ гардид. Масалан, соли 2002 ӯро интихоб карданд Архиви интернет ҳамчун яке аз форматҳо (дар баробари TIFF ва PDF) барои лоиҳа барои нигоҳ доштани китобҳои сканшуда аз манбаъҳои кушода.

Камбудиҳои формат

Аммо, мисли ҳама технологияҳо, DjVu камбудиҳои худро дорад. Масалан, ҳангоми рамзгузории сканҳои китобҳо ба формати DjVu, баъзе аломатҳои ҳуҷҷат метавонанд бо аломатҳои дигар иваз карда шаванд, ки намуди зоҳирӣ ба ҳам монанданд. Ин аксар вақт бо ҳарфҳои "i" ва "n" рух медиҳад, ки чаро ин мушкилот аст гирифта шудааст номи "ин проблема". Он аз забони матн вобаста нест ва аз ҷумла ба рақамҳо ва дигар аломатҳои такроршаванда таъсир мерасонад.

Сабаби он хатогиҳои таснифи аломатҳо дар рамзгузори JB2 мебошад. Он сканҳоро ба гурӯҳҳои аз 10 то 20 дона "тақсим мекунад" ва луғати рамзҳои умумиро барои ҳар як гурӯҳ ташкил медиҳад. Дар луғат намунаҳои ҳарфҳо ва рақамҳои умумӣ бо саҳифаҳо ва координатҳои намуди зоҳирии онҳо оварда шудаанд. Вақте ки шумо китоби DjVu-ро тамошо мекунед, аломатҳои луғат ба ҷойҳои лозима ворид карда мешаванд.

Ин ба шумо имкон медиҳад, ки андозаи файли DjVu-ро кам кунед, аммо агар намоишҳои ду ҳарф аз ҷиҳати визуалӣ ба ҳам монанд бошанд, рамзгузор метавонад онҳоро иштибоҳ кунад ё онҳоро бо ҳамон хато кунад. Баъзан ин боиси вайрон шудани формулахои хуччати техникй мегардад. Барои ҳалли ин мушкилот, шумо метавонед аз алгоритмҳои фишурда даст кашед, аммо ин андозаи нусхаи рақамии китобро зиёд мекунад.

Камбудии дигари формат дар он аст, ки он дар бисёр системаҳои оператсионии муосир (аз ҷумла мобилӣ) бо нобаёнӣ дастгирӣ намешавад. Аз ин рӯ, барои кор бо он шумо бояд тарафи сеюмро насб кунед барномаҳои, ба монанди DjVuReader, WinDjView, Evince ва ғайра. Аммо, дар ин ҷо мехоҳам қайд намоям, ки баъзе хонандагони электронӣ (масалан, ONYX BOOX) формати DjVu-ро «аз қуттӣ» дастгирӣ мекунанд - зеро дар он ҷо барномаҳои зарурӣ аллакай насб карда шудаанд.

Дар омади гап, мо дар бораи он сӯҳбат кардем, ки дигар барномаҳо барои хонандагони Android дар яке аз барномаҳои қаблӣ чӣ кор карда метавонанд маводҳо.

Китобҳои электронӣ ва форматҳои онҳо: DjVu - таърихи он, мусбат, манфи ва хусусиятҳои он
Хонанда ONYX BOOX Chronos

Мушкилоти дигари формат ҳангоми кор бо ҳуҷҷатҳои DjVu дар экранҳои хурди дастгоҳҳои мобилӣ - смартфонҳо, планшетҳо, хонандагон пайдо мешавад. Баъзан файлҳои DjVu дар шакли скани паҳншавии китоб пешниҳод карда мешаванд ва адабиёти касбӣ ва ҳуҷҷатҳои корӣ аксар вақт дар формати А4 мебошанд, бинобар ин шумо бояд тасвирро дар ҷустуҷӯи иттилоот "кӯчонед".

Вале мо кайд мекунем, ки ин проблемаро хам хал кардан мумкин аст. Роҳи осонтарин, албатта, ҷустуҷӯи ҳуҷҷат дар формати дигар аст - аммо агар ин имконнопазир бошад (масалан, шумо бояд бо миқдори зиёди адабиёти техникӣ дар DjVu кор кунед), пас шумо метавонед аз хонандагони электронӣ истифода баред. бо диагонали калон аз 9,7 то 13,3 дюйм, ки махсус барои кор бо чунин хуччатхо «мутобик» карда шудааст.

Масалан, дар хати ONYX BOOX чунин дастгоҳҳо ҳастанд Хронҳо и Максимум 2 (дар омади гап, мо баррасии ин модели хонандаро омода кардаем ва ба зудӣ онро дар блоги худ нашр хоҳем кард) ва инчунин Шарҳ, ки дорои экрани E Ink Mobius Carta бо диагонали 10,3 дюйм ва қарори баланд. Чунин дастгоҳҳо ба шумо имкон медиҳанд, ки ҳама ҷузъиёти тасвирҳоро бо андозаи аслии худ оромона тафтиш кунед ва барои онҳое, ки аксар вақт адабиёти таълимӣ ё техникӣ хондаанд, мувофиқанд. Барои дидани файлҳои DjVu ва PDF истифода бурда мешавад NEO Reader, ки ба шумо имкон медиҳад контраст ва ғафсии шрифтҳои рақамиро танзим кунед.

Сарфи назар аз камбудиҳои формат, имрӯз DjVu яке аз форматҳои маъмултарин барои “нигоҳ доштани” асарҳои адабӣ боқӣ мемонад. Ин асосан ба он вобаста аст, ки вай Ин аст, кушода аст ва баъзе маҳдудиятҳои технологӣ имрӯз имкон медиҳанд, ки технологияҳо ва таҳияҳои муосир аз он канорагирӣ кунанд.

Дар маводи зерин мо ҳикояро дар бораи таърихи пайдоиши форматҳои китобҳои электронӣ ва хусусиятҳои кори онҳоро идома медиҳем.

PS Якчанд маҷмӯи хонандагони ONYX BOOX:



Манбаъ: will.com

Илова Эзоҳ