70-аад оны эхээр Америкийн зохиолч Майкл Харт удирдаж байжээ
Өнөөдөр дижитал уран зохиол нь зөөврийн төхөөрөмж (ухаалаг утас, цахим уншигч, зөөврийн компьютер) хөгжсөний ачаар өргөн тархсан байна. Энэ нь олон тооны цахим номын форматыг бий болгоход хүргэсэн. Тэдний онцлогийг ойлгохыг хичээцгээе, тэдгээрийн хамгийн алдартай түүхийг яръя - DjVu форматаас эхэлье.
/flickr/
Формат үүсэх
DjVu-г 1996 онд AT&T Labs нэг зорилготойгоор бүтээсэн бөгөөд энэ нь вэб хөгжүүлэгчдэд интернетээр өндөр нарийвчлалтай зураг түгээх хэрэгсэл өгөх зорилготой юм.
Тэр үед бүх мэдээллийн 90% нь хэвээр байгаа нь баримт юм
Сонгодог вэб форматууд - JPEG, GIF, PNG нь ийм зурагтай ажиллах боломжтой болсон боловч эзлэхүүнтэй холбоотой. JPEG тохиолдолд, ингэснээр текст
Өөр нэг хувилбар бол OCR технологийг ашиглан цаасан баримт бичгийг дижитал хэлбэрт оруулах явдал байсан боловч 20 жилийн өмнө тэдгээрийн нарийвчлал нь тийм ч тохиромжтой биш байсан - боловсруулсны дараа эцсийн үр дүнг гараар нухацтай засах шаардлагатай байв. Үүний зэрэгцээ график, зураг нь "хэт" хэвээр байв. Сканнердсан зургийг текст баримт бичигт оруулах боломжтой байсан ч зарим харааны нарийн ширийн зүйлс, тухайлбал цаасны өнгө, түүний бүтэц алдагдсан бөгөөд эдгээр нь түүхэн баримт бичгийн чухал бүрэлдэхүүн хэсэг юм.
Эдгээр асуудлыг шийдэхийн тулд AT&T DjVu-г бүтээсэн. Энэ нь 300 dpi-ээс 40-60 KB хүртэлх нягтралтай сканнердсан өнгөт баримт бичгүүдийг 25 MB хэмжээтэй эх хэмжээтэй шахах боломжтой болгосон. DjVu нь хар цагаан хуудасны хэмжээг 10-30 KB болгон багасгасан.
DjVu баримт бичгийг хэрхэн шахдаг
DjVu нь сканнердсан цаасан баримт болон PDF гэх мэт бусад дижитал форматтай ажиллах боломжтой. DjVu хэрхэн ажилладаг
Маск нь анхны файлын нягтралаар хадгалагддаг ба
Энэ нь 300 dpi-ийн нарийвчлалтай бөгөөд нарийн зураас, үсгийн тоймыг тод байлгахын тулд AT&T-ийн JBIG2 факс алгоритмын хувилбар болох JB2 алгоритмыг ашиглан шахдаг. JB2-ийн онцлог
Арын дэвсгэр нь хуудасны бүтэц, дүрслэлийг агуулсан бөгөөд нягтрал нь маскныхаас бага байна. Алдагдалгүй дэвсгэр нь 100 dpi-д хадгалагдана.
Урд талын зураг
DjVu баримт бичгийг үүсгэх эцсийн шат бол дасан зохицох арифметик кодлогч нь ижил тэмдэгтүүдийн дарааллыг хоёртын утга болгон хувиргах үед энтропи кодчилол юм.
Форматын давуу тал
DjVu-ийн даалгавар байсан
Энэ нь мөн "татаж аваагүй" файлуудыг, өөрөөр хэлбэл олон хуудас DjVu баримт бичгийн бие даасан хуудсыг үзэх боломжтой болгодог. Энэ тохиолдолд файлыг татаж авах явцад бүрэлдэхүүн хэсгүүд нь "харагдах" мэт санагдах үед зургийн дэлгэрэнгүй зургийг ашигладаг (JPEG шиг).
20 жилийн өмнө энэ форматыг нэвтрүүлэхэд хуудсыг гурван үе шаттайгаар ачаалж байсан: эхлээд текстийн бүрэлдэхүүн хэсэг ачаалагдсан, хэдхэн секундын дараа зураг болон дэвсгэрийн эхний хувилбарууд ачаалагдсан. Дараа нь номын бүх хуудас "гарч ирлээ".
Гурван түвшний бүтэц байгаа нь сканнердсан номыг хайх боломжийг олгодог (тусгай текст давхарга байдаг). Энэ нь техникийн ном зохиол, лавлах номтой ажиллахад тохиромжтой байсан тул DjVu нь шинжлэх ухааны номын хэд хэдэн номын сангийн үндэс суурь болсон. Тухайлбал, 2002 онд түүнийг сонгосон
Форматын сул тал
Гэсэн хэдий ч бүх технологийн нэгэн адил DjVu нь сул талуудтай. Жишээлбэл, номын сканнерыг DjVu формат руу кодлох үед баримтын зарим тэмдэгтүүдийг гадаад төрхөөрөө ижил төстэй тэмдэгтүүдээр сольж болно. Энэ нь ихэвчлэн "i" ба "n" үсгүүдэд тохиолддог тул ийм асуудал гардаг
Үүний шалтгаан нь JB2 кодлогч дахь тэмдэгтийн ангиллын алдаа юм. Энэ нь сканнеруудыг 10-20 ширхэг бүлгүүдэд "хувааж", бүлэг бүрийн нийтлэг тэмдэгтүүдийн толь бичгийг бүрдүүлдэг. Энэхүү толь бичигт нийтлэг үсэг, тоонуудын жишээг хуудас, тэдгээрийн гадаад төрх байдлын координат агуулсан болно. Таныг DjVu ном үзэх үед толь бичгийн тэмдэгтүүдийг зөв газарт нь оруулна.
Энэ нь DjVu файлын хэмжээг багасгах боломжийг олгодог боловч хэрэв хоёр үсгийн харагдах байдал нь ижил төстэй байвал кодлогч тэдгээрийг төөрөлдүүлж эсвэл андуурч болно. Заримдаа энэ нь техникийн баримт бичигт томъёог гэмтээхэд хүргэдэг. Энэ асуудлыг шийдэхийн тулд та шахалтын алгоритмаас татгалзаж болно, гэхдээ энэ нь номын дижитал хуулбарын хэмжээг нэмэгдүүлэх болно.
Форматын өөр нэг сул тал нь орчин үеийн олон үйлдлийн системүүдэд (гар утасны системд) анхдагчаар дэмжигддэггүй явдал юм. Тиймээс түүнтэй ажиллахын тулд та гуравдагч этгээдийг суулгах хэрэгтэй
Дашрамд хэлэхэд, бид өмнөх програмуудын аль нэгэнд Android дээр суурилсан уншигчдад өөр юу хийж болох талаар ярилцсан
Уншигч
Ухаалаг утас, таблет, уншигч зэрэг гар утасны жижиг дэлгэц дээр DjVu баримт бичигтэй ажиллахад форматын өөр нэг асуудал гарч ирдэг. Заримдаа DjVu файлуудыг номны сканнер хэлбэрээр танилцуулдаг бөгөөд мэргэжлийн уран зохиол, ажлын баримт бичиг нь ихэвчлэн А4 форматтай байдаг тул мэдээлэл хайхдаа зургийг "зөөх" хэрэгтэй болдог.
Гэсэн хэдий ч энэ асуудлыг шийдэж болно гэдгийг бид тэмдэглэж байна. Мэдээжийн хэрэг, хамгийн хялбар арга бол өөр форматтай баримт бичгийг хайх явдал юм, гэхдээ хэрэв энэ сонголт боломжгүй бол (жишээлбэл, та DjVu-д их хэмжээний техникийн ном зохиолтой ажиллах хэрэгтэй) цахим уншигч ашиглаж болно. 9,7-аас 13,3 инч хүртэлх том диагональтай, ийм баримт бичигтэй ажиллахад тусгайлан "зассан".
Жишээлбэл, ONYX BOOX шугамд ийм төхөөрөмжүүд байдаг
Форматын дутагдалтай хэдий ч өнөөдөр DjVu нь утга зохиолын бүтээлүүдийг "хадгалах" хамгийн алдартай форматуудын нэг хэвээр байна. Энэ нь түүний гол шалтгаан юм
Дараах материалд бид цахим номын формат үүссэн түүх, тэдгээрийн ажлын онцлогуудын тухай түүхийг үргэлжлүүлэх болно.
Жич ONYX BOOX уншигчдын хэд хэдэн багц:
Технологи нь "эртний" эсрэг: ONYX BOOX Chronos уншигчийн тойм Хатан хаан уншихыг хүсч байна: ONYX BOOX Cleopatra 3 цахим номын тойм ONYX BOOX Darwin 4-ийн тойм: E-Ink дээрх шилдэг цахим ном
Эх сурвалж: www.habr.com