ในช่วงต้นทศวรรษที่ 70 Michael Hart นักเขียนชาวอเมริกันได้จัดการ
ปัจจุบัน วรรณกรรมดิจิทัลแพร่หลายมากขึ้น ต้องขอบคุณการพัฒนาอุปกรณ์พกพา (สมาร์ทโฟน เครื่องอ่านอีเล็คทรอนิกส์ แล็ปท็อป) สิ่งนี้นำไปสู่การเกิดขึ้นของรูปแบบ e-book จำนวนมาก ลองทำความเข้าใจคุณสมบัติของพวกเขาและบอกเล่าประวัติความเป็นมาของสิ่งที่ได้รับความนิยมมากที่สุด - เริ่มจากรูปแบบ DjVu กันก่อน
/flickr/
การเกิดขึ้นของรูปแบบ
DjVu ได้รับการพัฒนาในปี 1996 โดย AT&T Labs โดยมีวัตถุประสงค์เดียวคือเพื่อให้นักพัฒนาเว็บมีเครื่องมือในการเผยแพร่ภาพที่มีความละเอียดสูงผ่านทางอินเทอร์เน็ต
ความจริงก็คือ ณ เวลานั้น 90% ของข้อมูลทั้งหมดยังคงอยู่
รูปแบบเว็บคลาสสิก - JPEG, GIF และ PNG - ทำให้สามารถทำงานกับรูปภาพดังกล่าวได้ แต่ต้องแลกกับปริมาณ ในกรณีของ JPEG ดังนั้นข้อความ
ทางเลือกอื่นคือการแปลงเอกสารกระดาษให้เป็นดิจิทัลโดยใช้เทคโนโลยี OCR แต่เมื่อ 20 ปีที่แล้วความแม่นยำยังห่างไกลจากอุดมคติ หลังจากประมวลผลแล้ว ผลลัพธ์สุดท้ายจะต้องได้รับการแก้ไขด้วยมืออย่างจริงจัง ในขณะเดียวกัน กราฟิกและรูปภาพก็ยังคง "เกินมาตรฐาน" และแม้ว่าจะเป็นไปได้ที่จะฝังภาพที่สแกนลงในเอกสารข้อความ แต่รายละเอียดภาพบางส่วนก็หายไป เช่น สีของกระดาษ พื้นผิว และสิ่งเหล่านี้เป็นองค์ประกอบสำคัญของเอกสารทางประวัติศาสตร์
เพื่อแก้ไขปัญหาเหล่านี้ AT&T ได้พัฒนา DjVu ทำให้สามารถบีบอัดเอกสารสีที่สแกนด้วยความละเอียด 300 dpi ถึง 40–60 KB โดยมีขนาดต้นฉบับ 25 MB DjVu ลดขนาดหน้าขาวดำเหลือ 10–30 KB
DjVu บีบอัดเอกสารอย่างไร
DjVu สามารถทำงานกับทั้งเอกสารกระดาษที่สแกนและรูปแบบดิจิทัลอื่น ๆ เช่น PDF DjVu ทำงานอย่างไร
หน้ากากจะถูกบันทึกตามความละเอียดของไฟล์ต้นฉบับและ
มีความละเอียด 300 dpi เพื่อให้เส้นละเอียดและโครงร่างตัวอักษรคมชัด และถูกบีบอัดโดยใช้อัลกอริธึม JB2 ซึ่งเป็นรูปแบบหนึ่งของอัลกอริธึม JBIG2 ของ AT&T สำหรับการส่งแฟกซ์ ฟีเจอร์ของ JB2
พื้นหลังประกอบด้วยพื้นผิวของหน้าและภาพประกอบ และมีความละเอียดต่ำกว่าของมาสก์ พื้นหลังแบบไม่สูญเสียจะถูกบันทึกที่ 100 dpi
เบื้องหน้า
ขั้นตอนสุดท้ายของการสร้างเอกสาร DjVu คือการเข้ารหัสเอนโทรปี เมื่อตัวเข้ารหัสทางคณิตศาสตร์ที่ปรับเปลี่ยนได้จะเปลี่ยนลำดับของอักขระที่เหมือนกันให้เป็นค่าไบนารี่
ข้อดีของรูปแบบ
งานของ DjVu คือ
นอกจากนี้ยังทำให้สามารถดูไฟล์ "ที่ไม่ได้ดาวน์โหลด" ซึ่งก็คือแต่ละหน้าของเอกสาร DjVu แบบหลายหน้าได้ ในกรณีนี้ จะใช้การวาดรายละเอียดของภาพแบบโปรเกรสซีฟ เมื่อส่วนประกอบต่างๆ ดูเหมือน “ปรากฏขึ้น” ขณะดาวน์โหลดไฟล์ (เช่นในรูปแบบ JPEG)
เมื่อ 20 ปีที่แล้ว เมื่อมีการเปิดตัวรูปแบบนี้ หน้าเว็บถูกโหลดในสามขั้นตอน: ขั้นแรกโหลดส่วนประกอบข้อความ หลังจากนั้นไม่กี่วินาที รูปภาพและพื้นหลังเวอร์ชันแรกก็ถูกโหลด หลังจากนั้นหนังสือทั้งหน้าก็ “ปรากฏขึ้น”
การมีอยู่ของโครงสร้างสามระดับยังช่วยให้คุณค้นหาหนังสือที่สแกนได้ (เนื่องจากมีเลเยอร์ข้อความพิเศษ) สิ่งนี้กลายเป็นเรื่องสะดวกเมื่อทำงานกับวรรณกรรมด้านเทคนิคและหนังสืออ้างอิง ดังนั้น DjVu จึงกลายเป็นพื้นฐานสำหรับห้องสมุดหนังสือวิทยาศาสตร์หลายแห่ง ตัวอย่างเช่นในปี 2002 เขาได้รับเลือก
ข้อเสียของรูปแบบ
อย่างไรก็ตาม เช่นเดียวกับเทคโนโลยีอื่นๆ DjVu ก็มีข้อเสียเช่นกัน ตัวอย่างเช่น เมื่อเข้ารหัสการสแกนหนังสือเป็นรูปแบบ DjVu อักขระบางตัวในเอกสารอาจถูกแทนที่ด้วยอักขระอื่นที่มีลักษณะคล้ายกัน สิ่งนี้มักเกิดขึ้นกับตัวอักษร "i" และ "n" ซึ่งเป็นสาเหตุของปัญหานี้
สาเหตุคือข้อผิดพลาดในการจำแนกอักขระในตัวเข้ารหัส JB2 โดยจะ "แยก" สแกนเป็นกลุ่มๆ ละ 10-20 ชิ้นและสร้างพจนานุกรมสัญลักษณ์ทั่วไปสำหรับแต่ละกลุ่ม พจนานุกรมประกอบด้วยตัวอย่างตัวอักษรและตัวเลขทั่วไปพร้อมหน้าและพิกัดของลักษณะที่ปรากฏ เมื่อคุณดูหนังสือ DjVu ตัวอักษรจากพจนานุกรมจะถูกแทรกในตำแหน่งที่ถูกต้อง
วิธีนี้ช่วยให้คุณลดขนาดของไฟล์ DjVu ได้ อย่างไรก็ตาม หากการแสดงตัวอักษรสองตัวมีความคล้ายคลึงกัน ตัวเข้ารหัสอาจทำให้สับสนหรือเข้าใจผิดว่าเหมือนกันได้ บางครั้งสิ่งนี้อาจนำไปสู่ความเสียหายต่อสูตรในเอกสารทางเทคนิค เพื่อแก้ปัญหานี้ คุณสามารถละทิ้งอัลกอริธึมการบีบอัดได้ แต่จะเพิ่มขนาดของสำเนาดิจิทัลของหนังสือ
ข้อเสียอีกประการหนึ่งของรูปแบบนี้คือไม่รองรับค่าเริ่มต้นในระบบปฏิบัติการสมัยใหม่หลายระบบ (รวมถึงอุปกรณ์พกพาด้วย) ดังนั้นในการทำงานกับมันคุณต้องติดตั้งบุคคลที่สาม
โดยวิธีการที่เราพูดคุยเกี่ยวกับสิ่งที่แอปพลิเคชันสำหรับผู้อ่านที่ใช้ Android สามารถทำได้ในก่อนหน้านี้
ผู้อ่าน
ปัญหารูปแบบอื่นปรากฏขึ้นเมื่อทำงานกับเอกสาร DjVu บนหน้าจอขนาดเล็กของอุปกรณ์มือถือ - สมาร์ทโฟน แท็บเล็ต เครื่องอ่าน บางครั้งไฟล์ DjVu จะถูกนำเสนอในรูปแบบของการสแกนการแพร่กระจายหนังสือ และวรรณกรรมระดับมืออาชีพและเอกสารการทำงานมักจะอยู่ในรูปแบบ A4 ดังนั้นคุณต้อง "ย้าย" รูปภาพเพื่อค้นหาข้อมูล
อย่างไรก็ตาม เราทราบว่าปัญหานี้สามารถแก้ไขได้เช่นกัน วิธีที่ง่ายที่สุดคือการค้นหาเอกสารในรูปแบบอื่น - แต่ถ้าตัวเลือกนี้เป็นไปไม่ได้ (เช่นคุณต้องทำงานกับวรรณกรรมทางเทคนิคจำนวนมากใน DjVu) คุณสามารถใช้เครื่องอ่านอิเล็กทรอนิกส์ได้ ด้วยเส้นทแยงมุมขนาดใหญ่ตั้งแต่ 9,7 ถึง 13,3 นิ้ว ซึ่ง "ปรับแต่ง" เป็นพิเศษสำหรับการทำงานกับเอกสารดังกล่าว
เช่นในสาย ONYX BOOX อุปกรณ์ดังกล่าวได้แก่
แม้จะมีข้อบกพร่องของรูปแบบ แต่ในปัจจุบัน DjVu ยังคงเป็นหนึ่งในรูปแบบที่ได้รับความนิยมมากที่สุดสำหรับ "การอนุรักษ์" งานวรรณกรรม นี่เป็นสาเหตุหลักมาจากการที่เขา
ในเนื้อหาต่อไปนี้ เราจะเล่าเรื่องราวเกี่ยวกับประวัติความเป็นมาของรูปแบบ e-book และคุณลักษณะของงานต่อไป
ป.ล. เครื่องอ่าน ONYX BOOX หลายชุด:
เทคโนโลยีกับ "สมัยโบราณ": บทวิจารณ์เครื่องอ่าน ONYX BOOX Chronos ราชินียอมอ่าน: บทวิจารณ์ e-book ของ ONYX BOOX Cleopatra 3 รีวิว ONYX BOOX Darwin 4: e-book ที่ดีที่สุดบน E-Ink
ที่มา: will.com