کتاب های الکترونیکی و فرمت های آنها: DjVu - تاریخچه، جوانب مثبت، معایب و ویژگی های آن

در اوایل دهه 70، نویسنده آمریکایی مایکل هارت مدیریت کرد دریافت کنید دسترسی نامحدود به رایانه زیراکس سیگما 5 نصب شده در دانشگاه ایلینوی. برای استفاده مناسب از منابع دستگاه، او تصمیم گرفت اولین کتاب الکترونیکی را ایجاد کند که اعلامیه استقلال ایالات متحده را دوباره چاپ می کرد.

امروزه، ادبیات دیجیتال عمدتاً به لطف توسعه دستگاه‌های قابل حمل (تلفن‌های هوشمند، کتاب‌خوان‌های الکترونیکی، لپ‌تاپ‌ها) گسترده شده است. این امر منجر به ظهور تعداد زیادی فرمت کتاب الکترونیکی شده است. بیایید سعی کنیم ویژگی های آنها را درک کنیم و تاریخچه محبوب ترین آنها را بگوییم - بیایید با فرمت DjVu شروع کنیم.

کتاب های الکترونیکی و فرمت های آنها: DjVu - تاریخچه، جوانب مثبت، معایب و ویژگی های آن
/flickr/ لین پیرمن / CC

ظهور قالب

DjVu در سال 1996 توسط آزمایشگاه AT&T با یک هدف توسعه یافت - ارائه ابزاری برای توسعه دهندگان وب برای توزیع تصاویر با وضوح بالا در اینترنت.

واقعیت این است که در آن زمان 90٪ از کل اطلاعات هنوز باقی مانده است ذخیره شد روی کاغذ، و بسیاری از اسناد مهم دارای تصاویر و عکس های رنگی بودند. برای حفظ خوانایی متن و کیفیت تصاویر، لازم بود اسکن هایی با وضوح بالا انجام شود.

فرمت های وب کلاسیک - JPEG، GIF و PNG - کار با چنین تصاویری را ممکن می کند، اما به قیمت حجم. در مورد JPEG، به طوری که متن خوانده شد در صفحه مانیتور، من مجبور شدم سند را با وضوح 300 dpi اسکن کنم. یک صفحه رنگی مجله حدود 500 کیلوبایت را اشغال می کرد. دانلود فایل هایی با این اندازه از اینترنت در آن زمان یک فرآیند کاملاً پر زحمت بود.

گزینه جایگزین دیجیتالی کردن اسناد کاغذی با استفاده از فناوری های OCR بود، اما 20 سال پیش دقت آنها بسیار ایده آل نبود - پس از پردازش، نتیجه نهایی باید به طور جدی با دست ویرایش می شد. در همان زمان، گرافیک ها و تصاویر "در سطح دریا" باقی ماندند. و حتی اگر امکان جاسازی یک تصویر اسکن شده در یک سند متنی وجود داشت، برخی از جزئیات بصری از بین رفت، به عنوان مثال، رنگ کاغذ، بافت آن، و اینها اجزای مهم اسناد تاریخی هستند.

به منظور حل این مشکلات، AT&T DjVu را توسعه داد. این امکان فشرده سازی اسناد رنگی اسکن شده با وضوح 300 نقطه در اینچ را به 40 تا 60 کیلوبایت با حجم اصلی 25 مگابایت فراهم کرد. DjVu حجم صفحات سیاه و سفید را به 10 تا 30 کیلوبایت کاهش داد.

چگونه DjVu اسناد را فشرده می کند

DjVu می تواند با اسناد کاغذی اسکن شده و سایر فرمت های دیجیتال مانند PDF کار کند. DjVu چگونه کار می کند است فناوری که تصویر را به سه بخش تقسیم می کند: پیش زمینه، پس زمینه و ماسک سیاه و سفید (بیت).

ماسک با وضوح فایل اصلی ذخیره می شود و حاوی تصویر متن و سایر جزئیات واضح - خطوط ظریف و نمودارها - و همچنین تصاویر متضاد.

وضوح آن 300 نقطه در اینچ است تا خطوط ظریف و خطوط خطوط را واضح نگه دارد و با استفاده از الگوریتم JB2 فشرده می شود، که نوعی از الگوریتم JBIG2 AT&T برای فکس است. ویژگی JB2 آن است کاری که انجام می دهد این است که به دنبال کاراکترهای تکراری در صفحه می گردد و تنها یک بار تصویر آنها را ذخیره می کند. بنابراین، در اسناد چند صفحه ای، هر چند صفحه متوالی یک «فرهنگ لغت» مشترک دارند.

پس زمینه شامل بافت صفحه و تصاویر است و وضوح آن کمتر از ماسک است. پس زمینه بدون اتلاف در 100 نقطه در اینچ ذخیره می شود.

پیش زمینه نگه می دارد اطلاعات رنگ در مورد ماسک و وضوح آن معمولاً حتی بیشتر کاهش می یابد، زیرا در بیشتر موارد رنگ متن سیاه است و برای یک کاراکتر چاپ شده یکسان است. برای فشرده سازی پیش زمینه و پس زمینه استفاده می شود فشرده سازی موجک.

مرحله نهایی ایجاد یک سند DjVu، رمزگذاری آنتروپی است، زمانی که یک رمزگذار حسابی تطبیقی، دنباله هایی از کاراکترهای یکسان را به یک مقدار باینری تبدیل می کند.

مزایای فرمت

وظیفه DjVu بود صرفه جویی "خواص" یک سند کاغذی به شکل دیجیتال، به کامپیوترهای ضعیف اجازه می دهد تا با چنین اسنادی کار کنند. بنابراین نرم افزار مشاهده فایل های DjVu قابلیت “رندر سریع” را دارد. با تشکر از او به یادگار بارگذاری فقط آن قسمت از صفحه DjVu که باید روی صفحه نمایش داده شود.

این همچنین امکان مشاهده فایل‌های «دانلود نشده»، یعنی صفحات جداگانه یک سند چند صفحه‌ای DjVu را فراهم می‌کند. در این مورد، از ترسیم تدریجی جزئیات تصویر استفاده می‌شود، زمانی که به نظر می‌رسد اجزا در هنگام دانلود فایل ظاهر می‌شوند (مانند JPEG).

20 سال پیش که این فرمت معرفی شد، صفحه در سه مرحله بارگذاری شد: ابتدا کامپوننت متن بارگذاری شد، پس از چند ثانیه اولین نسخه های تصاویر و پس زمینه بارگذاری شد. پس از آن، کل صفحه کتاب «نمایش شد».

وجود یک ساختار سه سطحی همچنین به شما امکان می دهد در کتاب های اسکن شده جستجو کنید (زیرا یک لایه متن ویژه وجود دارد). این امر هنگام کار با ادبیات فنی و کتاب های مرجع راحت بود، بنابراین DjVu مبنایی برای چندین کتابخانه از کتاب های علمی شد. مثلا در سال 2002 انتخاب شد آرشیو اینترنت به عنوان یکی از فرمت ها (به همراه TIFF و PDF) برای پروژه ای برای حفظ کتاب های اسکن شده از منابع باز.

معایب فرمت

با این حال، مانند همه فن آوری ها، DjVu دارای معایبی است. به عنوان مثال، هنگام رمزگذاری اسکن کتاب ها در قالب DjVu، برخی از کاراکترهای سند ممکن است با کاراکترهای دیگری جایگزین شوند که از نظر ظاهری مشابه هستند. این اغلب با حروف "i" و "n" اتفاق می افتد، به همین دلیل این مشکل وجود دارد اخذ شده نام "مشکل یین". این به زبان متن بستگی ندارد و از جمله بر اعداد و سایر شخصیت های تکراری کوچک تأثیر می گذارد.

علت آن خطاهای طبقه بندی کاراکتر در رمزگذار JB2 است. اسکن‌ها را به گروه‌های 10 تا 20 قطعه تقسیم می‌کند و فرهنگ لغت نمادهای مشترک برای هر گروه را تشکیل می‌دهد. فرهنگ لغت شامل نمونه هایی از حروف و اعداد رایج با صفحات و مختصات ظاهری آنهاست. هنگامی که یک کتاب DjVu را مشاهده می کنید، کاراکترهای فرهنگ لغت در مکان های مناسب درج می شوند.

این به شما امکان می دهد تا اندازه فایل DjVu را کاهش دهید، با این حال، اگر نمایش دو حرف از نظر بصری مشابه باشند، رمزگذار می تواند آنها را اشتباه گرفته یا آنها را با همان اشتباه اشتباه کند. گاهی اوقات این منجر به آسیب به فرمول ها در یک سند فنی می شود. برای حل این مشکل، می توانید الگوریتم های فشرده سازی را کنار بگذارید، اما این کار باعث افزایش حجم نسخه دیجیتالی کتاب می شود.

یکی دیگر از معایب فرمت این است که به طور پیش فرض در بسیاری از سیستم عامل های مدرن (از جمله دستگاه های تلفن همراه) پشتیبانی نمی شود. بنابراین، برای کار با آن باید شخص ثالث را نصب کنید برنامه، مانند DjVuReader، WinDjView، Evince، و غیره. با این حال، در اینجا می خواهم توجه داشته باشم که برخی از خوانندگان الکترونیکی (به عنوان مثال، ONYX BOOX) از فرمت DjVu "خارج از جعبه" پشتیبانی می کنند - زیرا برنامه های کاربردی لازم قبلاً در آنجا نصب شده اند.

به هر حال، ما در مورد کارهای دیگری که برنامه های خوانندگان مبتنی بر اندروید می توانند انجام دهند در یکی از موارد قبلی صحبت کردیم مصالح.

کتاب های الکترونیکی و فرمت های آنها: DjVu - تاریخچه، جوانب مثبت، معایب و ویژگی های آن
خواننده ONYX BOOX Chronos

مشکل فرمت دیگری هنگام کار با اسناد DjVu بر روی صفحه نمایش های کوچک دستگاه های تلفن همراه - گوشی های هوشمند، تبلت ها، خواننده ها ظاهر می شود. گاهی اوقات فایل‌های DjVu به صورت اسکن از یک کتاب ارائه می‌شوند، و ادبیات حرفه‌ای و اسناد کاری اغلب در فرمت A4 هستند، بنابراین شما باید تصویر را در جستجوی اطلاعات "جابجایی" کنید.

با این حال، توجه داشته باشیم که این مشکل نیز قابل حل است. البته ساده ترین راه این است که به دنبال یک سند با فرمت متفاوت بگردید - اما اگر این گزینه امکان پذیر نیست (به عنوان مثال، شما باید با حجم زیادی از ادبیات فنی در DjVu کار کنید)، می توانید از خوانندگان الکترونیکی استفاده کنید. با مورب بزرگ از 9,7 تا 13,3 اینچ که مخصوص کار با چنین اسنادی است.

به عنوان مثال، در خط ONYX BOOX چنین دستگاه هایی هستند کرونوس и MAX 2 (البته ما بررسی این مدل خواننده را آماده کرده ایم و به زودی در وبلاگ خود منتشر خواهیم کرد) و همچنین توجه داشته باشید، که دارای صفحه نمایش E Ink Mobius Carta با قطر 10,3 اینچ و وضوح افزایش یافته است. چنین دستگاه هایی به شما امکان می دهد با آرامش تمام جزئیات تصاویر را در اندازه اصلی آنها بررسی کنید و برای کسانی که اغلب مجبور به خواندن ادبیات آموزشی یا فنی هستند مناسب هستند. برای مشاهده فایل های DjVu و PDF استفاده می شود NEO Reader که به شما امکان می دهد کنتراست و ضخامت فونت های دیجیتالی را تنظیم کنید.

با وجود کاستی‌های این قالب، امروزه DjVu یکی از محبوب‌ترین قالب‌ها برای «حفظ» آثار ادبی است. این تا حد زیادی به دلیل این واقعیت است که او آن است باز است و برخی محدودیت‌های تکنولوژیک امروزه به فناوری‌ها و پیشرفت‌های مدرن اجازه می‌دهد از آن عبور کنند.

در مطالب بعدی به ادامه داستان در مورد تاریخچه پیدایش قالب های کتاب الکترونیکی و ویژگی های کار آنها خواهیم پرداخت.

PS چندین مجموعه از خواننده های ONYX BOOX:



منبع: www.habr.com

اضافه کردن نظر