ای کتابیں اور ان کی شکلیں: DjVu - اس کی تاریخ، فوائد، نقصانات اور خصوصیات

70 کی دہائی کے اوائل میں امریکی مصنف مائیکل ہارٹ نے اس کا انتظام کیا۔ حاصل کرنے کے لئے الینوائے یونیورسٹی میں نصب زیروکس سگما 5 کمپیوٹر تک لامحدود رسائی۔ مشین کے وسائل کا اچھا استعمال کرنے کے لیے، اس نے پہلی الیکٹرانک کتاب بنانے کا فیصلہ کیا، جس میں امریکی اعلانِ آزادی کو دوبارہ چھاپا۔

آج، ڈیجیٹل ادب وسیع ہو گیا ہے، زیادہ تر پورٹیبل آلات (اسمارٹ فونز، ای ریڈرز، لیپ ٹاپ) کی ترقی کی بدولت۔ اس کی وجہ سے بڑی تعداد میں ای بک فارمیٹس کا ظہور ہوا ہے۔ آئیے ان کی خصوصیات کو سمجھنے کی کوشش کریں اور ان میں سے سب سے زیادہ مقبول کی تاریخ بتائیں - آئیے DjVu فارمیٹ سے آغاز کرتے ہیں۔

ای کتابیں اور ان کی شکلیں: DjVu - اس کی تاریخ، فوائد، نقصانات اور خصوصیات
/flickr/ لین پیئر مین / CC

شکل کا ظہور

DjVu کو 1996 میں AT&T Labs نے ایک مقصد کے ساتھ تیار کیا تھا - ویب ڈویلپرز کو انٹرنیٹ پر ہائی ریزولیوشن امیجز کی تقسیم کے لیے ایک ٹول فراہم کرنا۔

حقیقت یہ ہے کہ اس وقت تمام معلومات کا 90% ابھی بھی ہے۔ ذخیرہ کیا گیا تھا کاغذ پر، اور بہت سے اہم دستاویزات میں رنگین تصاویر اور تصاویر تھیں۔ متن کی پڑھنے کی اہلیت اور تصویروں کے معیار کو برقرار رکھنے کے لیے ہائی ریزولوشن اسکین کرنا ضروری تھا۔

کلاسک ویب فارمیٹس - JPEG، GIF اور PNG - نے ایسی تصاویر کے ساتھ کام کرنا ممکن بنایا، لیکن حجم کی قیمت پر۔ JPEG کے معاملے میں، تاکہ متن پڑھا تھا مانیٹر اسکرین پر، مجھے دستاویز کو 300 dpi کی ریزولوشن کے ساتھ اسکین کرنا پڑا۔ میگزین کا ایک رنگین صفحہ تقریباً 500 KB پر محیط ہے۔ انٹرنیٹ سے اس سائز کی فائلوں کو ڈاؤن لوڈ کرنا اس وقت کافی محنت طلب عمل تھا۔

متبادل کاغذی دستاویزات کو OCR ٹیکنالوجیز کا استعمال کرتے ہوئے ڈیجیٹائز کرنا تھا، لیکن 20 سال پہلے ان کی درستگی مثالی نہیں تھی - پروسیسنگ کے بعد، حتمی نتیجہ کو سنجیدگی سے ہاتھ سے ایڈٹ کرنا پڑا۔ ایک ہی وقت میں، گرافکس اور تصاویر "اوور بورڈ" رہیں۔ اور یہاں تک کہ اگر سکین شدہ تصویر کو ٹیکسٹ دستاویز میں شامل کرنا ممکن تھا، تو کچھ بصری تفصیلات ضائع ہو گئیں، مثال کے طور پر، کاغذ کا رنگ، اس کی ساخت، اور یہ تاریخی دستاویزات کے اہم اجزاء ہیں۔

ان مسائل کو حل کرنے کے لیے، AT&T نے DjVu تیار کیا۔ اس نے اسکین شدہ رنگین دستاویزات کو 300 dpi کی ریزولوشن سے 40–60 KB تک کمپریس کرنا ممکن بنایا، جس کا اصل سائز 25 MB ہے۔ DjVu نے سیاہ اور سفید صفحات کا سائز کم کر کے 10–30 KB کر دیا۔

کس طرح DjVu دستاویزات کو کمپریس کرتا ہے۔

DjVu اسکین شدہ کاغذی دستاویزات اور دیگر ڈیجیٹل فارمیٹس، جیسے پی ڈی ایف دونوں کے ساتھ کام کر سکتا ہے۔ DjVu کیسے کام کرتا ہے۔ جھوٹ ہے ٹیکنالوجی جو تصویر کو تین حصوں میں تقسیم کرتی ہے: پیش منظر، پس منظر اور سیاہ اور سفید (بٹ) ماسک۔

ماسک کو اصل فائل کے ریزولوشن پر محفوظ کیا جاتا ہے اور مشتمل متن کی تصویر اور دیگر واضح تفصیلات - عمدہ لکیریں اور خاکے - نیز متضاد تصویریں۔

اس کی ریزولوشن 300 dpi ہے تاکہ ٹھیک لائنوں اور خط کی خاکہ کو تیز رکھا جا سکے، اور اسے JB2 الگورتھم کا استعمال کرتے ہوئے کمپریس کیا جاتا ہے، جو کہ فیکس کرنے کے لیے AT&T کے JBIG2 الگورتھم کا ایک تغیر ہے۔ JB2 کی خصوصیت ہے یہ کیا کرتا ہے یہ صفحہ پر ڈپلیکیٹ حروف تلاش کرتا ہے اور ان کی تصویر کو صرف ایک بار محفوظ کرتا ہے۔ اس طرح، کثیر صفحاتی دستاویزات میں، ہر چند لگاتار صفحات ایک مشترکہ "لغت" کا اشتراک کرتے ہیں۔

پس منظر میں صفحہ کی ساخت اور عکاسی شامل ہے، اور اس کی ریزولوشن ماسک سے کم ہے۔ بغیر نقصان کے پس منظر کو 100 dpi پر محفوظ کیا جاتا ہے۔

پیش منظر اسٹورز ماسک کے بارے میں رنگین معلومات، اور اس کی ریزولیوشن کو عام طور پر اور بھی کم کر دیا جاتا ہے، کیونکہ زیادہ تر معاملات میں ٹیکسٹ کا رنگ سیاہ ہوتا ہے اور ایک پرنٹ شدہ کریکٹر کے لیے ایک جیسا ہوتا ہے۔ پیش منظر اور پس منظر کو سکیڑنے کے لیے استعمال کیا جاتا ہے۔ ویولیٹ کمپریشن.

DjVu دستاویز بنانے کا آخری مرحلہ اینٹروپی انکوڈنگ ہے، جب ایک انکولی ریاضی کا انکوڈر ایک جیسے حروف کی ترتیب کو بائنری قدر میں بدل دیتا ہے۔

فارمیٹ کے فوائد

DjVu کا کام تھا۔ کو بچانے کے ڈیجیٹل شکل میں کاغذی دستاویز کی "پراپرٹیز"، یہاں تک کہ کمزور کمپیوٹرز کو بھی ایسی دستاویزات کے ساتھ کام کرنے کی اجازت دیتا ہے۔ لہذا، DjVu فائلوں کو دیکھنے کے سافٹ ویئر میں "تیز رینڈرنگ" کی صلاحیت ہے۔ اس کی یاد میں شکریہ لوڈ ہو رہا ہے DjVu صفحہ کا صرف وہی ٹکڑا جو اسکرین پر ظاہر ہونا چاہیے۔

یہ "ان ڈاؤن لوڈ شدہ" فائلوں کو دیکھنا بھی ممکن بناتا ہے، یعنی ملٹی پیج DjVu دستاویز کے انفرادی صفحات۔ اس صورت میں، تصویر کی تفصیلات کی پروگریسو ڈرائنگ کا استعمال کیا جاتا ہے، جب فائل ڈاؤن لوڈ ہونے پر اجزاء "ظاہر" ہوتے ہیں (جیسا کہ JPEG میں)۔

20 سال پہلے، جب یہ فارمیٹ متعارف کرایا گیا تھا، صفحہ کو تین مراحل میں لوڈ کیا گیا تھا: پہلے متن کا جزو لوڈ کیا گیا، چند سیکنڈ کے بعد تصاویر کے پہلے ورژن اور پس منظر کو لوڈ کیا گیا۔ اس کے بعد، کتاب کا پورا صفحہ "نمودار ہوا۔"

تین سطحی ڈھانچے کی موجودگی بھی آپ کو اسکین شدہ کتابوں کے ذریعے تلاش کرنے کی اجازت دیتی ہے (کیونکہ ایک خاص متن کی تہہ موجود ہے)۔ تکنیکی ادب اور حوالہ جاتی کتابوں کے ساتھ کام کرتے وقت یہ آسان ثابت ہوا، لہذا DjVu سائنسی کتابوں کی کئی لائبریریوں کی بنیاد بن گئی۔ مثال کے طور پر، 2002 میں انہیں منتخب کیا گیا تھا انٹرنیٹ آرکائیو کھلے ذرائع سے اسکین شدہ کتابوں کو محفوظ کرنے کے منصوبے کے لیے فارمیٹس میں سے ایک کے طور پر (TIFF اور PDF کے ساتھ)۔

فارمیٹ کے نقصانات

تاہم، تمام ٹیکنالوجیز کی طرح، DjVu میں بھی اپنی خامیاں ہیں۔ مثال کے طور پر، کتابوں کے اسکین کو DjVu فارمیٹ میں انکوڈنگ کرتے وقت، دستاویز میں کچھ حروف کو دوسرے سے تبدیل کیا جا سکتا ہے جو ظاہری شکل میں ملتے جلتے ہیں۔ یہ اکثر حروف "i" اور "n" کے ساتھ ہوتا ہے، یہی وجہ ہے کہ یہ مسئلہ ہے۔ ملا نام "ین مسئلہ"۔ یہ متن کی زبان پر منحصر نہیں ہے اور دوسری چیزوں کے علاوہ، اعداد اور دوسرے چھوٹے دہرائے جانے والے حروف کو متاثر کرتا ہے۔

اس کی وجہ JB2 انکوڈر میں کریکٹر کی درجہ بندی کی غلطیاں ہیں۔ یہ 10-20 ٹکڑوں کے گروپوں میں اسکین کرتا ہے اور ہر گروپ کے لیے مشترکہ علامتوں کی ایک لغت بناتا ہے۔ لغت میں عام حروف اور اعداد کی مثالیں ہیں جن کے صفحات اور ان کی ظاہری شکل کے نقاط ہیں۔ جب آپ DjVu کتاب دیکھتے ہیں تو لغت کے حروف صحیح جگہوں پر داخل کیے جاتے ہیں۔

یہ آپ کو DjVu فائل کے سائز کو کم کرنے کی اجازت دیتا ہے، تاہم، اگر دو حروف کے ڈسپلے بصری طور پر ایک جیسے ہیں، تو انکوڈر یا تو انہیں الجھ سکتا ہے یا ان سے غلطی کر سکتا ہے۔ بعض اوقات یہ تکنیکی دستاویز میں فارمولوں کو نقصان پہنچاتا ہے۔ اس مسئلے کو حل کرنے کے لیے، آپ کمپریشن الگورتھم کو ترک کر سکتے ہیں، لیکن اس سے کتاب کی ڈیجیٹل کاپی کا سائز بڑھ جائے گا۔

فارمیٹ کا ایک اور نقصان یہ ہے کہ یہ بہت سے جدید آپریٹنگ سسٹمز (بشمول موبائل والے) میں بطور ڈیفالٹ تعاون یافتہ نہیں ہے۔ لہذا، اس کے ساتھ کام کرنے کے لیے آپ کو تھرڈ پارٹی انسٹال کرنے کی ضرورت ہے۔ پروگرامزجیسا کہ DjVuReader، WinDjView، Evince، وغیرہ۔ تاہم، یہاں میں یہ نوٹ کرنا چاہوں گا کہ کچھ الیکٹرانک ریڈرز (مثال کے طور پر، ONYX BOOX) DjVu فارمیٹ کو "آؤٹ آف دی باکس" سپورٹ کرتے ہیں - چونکہ وہاں ضروری ایپلیکیشنز پہلے سے انسٹال ہیں۔

ویسے، ہم نے اس بارے میں بات کی تھی کہ اینڈرائیڈ پر مبنی قارئین کے لیے اور کیا ایپلی کیشنز پچھلے میں سے ایک میں کر سکتی ہیں۔ مواد.

ای کتابیں اور ان کی شکلیں: DjVu - اس کی تاریخ، فوائد، نقصانات اور خصوصیات
قاری ONYX BOOX Chronos

موبائل آلات کی چھوٹی اسکرینوں - اسمارٹ فونز، ٹیبلٹس، ریڈرز پر DjVu دستاویزات کے ساتھ کام کرتے وقت ایک اور فارمیٹ کا مسئلہ ظاہر ہوتا ہے۔ کبھی کبھی DjVu فائلیں بک اسپریڈ کے اسکین کی شکل میں پیش کی جاتی ہیں، اور پیشہ ورانہ لٹریچر اور ورکنگ دستاویزات اکثر A4 فارمیٹ میں ہوتے ہیں، اس لیے آپ کو معلومات کی تلاش میں تصویر کو "منتقل" کرنا پڑتا ہے۔

تاہم، ہم نوٹ کرتے ہیں کہ یہ مسئلہ بھی حل کیا جا سکتا ہے. یقیناً سب سے آسان طریقہ یہ ہے کہ کسی دستاویز کو مختلف فارمیٹ میں تلاش کیا جائے - لیکن اگر یہ آپشن ممکن نہیں ہے (مثال کے طور پر، آپ کو DjVu میں بڑی مقدار میں تکنیکی ادب کے ساتھ کام کرنے کی ضرورت ہے)، تو آپ الیکٹرانک ریڈرز استعمال کر سکتے ہیں۔ 9,7 سے 13,3 انچ تک بڑے اخترن کے ساتھ، جو اس طرح کے دستاویزات کے ساتھ کام کرنے کے لیے خاص طور پر "مطابق" بنایا گیا ہے۔

مثال کے طور پر، ONYX BOOX لائن میں ایسے آلات ہیں۔ کرونوس и MAX 2 (ویسے، ہم نے اس ریڈر ماڈل کا ایک جائزہ تیار کیا ہے، اور جلد ہی اسے اپنے بلاگ پر شائع کریں گے)، اور یہ بھی نوٹجس میں E Ink Mobius Carta اسکرین ہے جس کا اخترن 10,3 انچ ہے اور ریزولوشن بڑھا ہوا ہے۔ اس طرح کے آلات آپ کو ان کے اصل سائز میں عکاسی کی تمام تفصیلات کو پرسکون طور پر جانچنے کی اجازت دیتے ہیں اور ان لوگوں کے لئے موزوں ہیں جنہیں اکثر تعلیمی یا تکنیکی ادب پڑھنا پڑتا ہے۔ DjVu اور PDF فائلیں دیکھنے کے لیے استعمال کیا جاتا ہے۔ NEO ریڈر، جو آپ کو ڈیجیٹائزڈ فونٹس کے کنٹراسٹ اور موٹائی کو ایڈجسٹ کرنے کی اجازت دیتا ہے۔

فارمیٹ کی خامیوں کے باوجود، آج DjVu ادبی کاموں کو "محفوظ" کرنے کے لیے سب سے مقبول فارمیٹس میں سے ایک ہے۔ یہ بڑی حد تک اس حقیقت کی وجہ سے ہے کہ وہ ہے کھلا، اور کچھ تکنیکی حدود آج جدید ٹیکنالوجیز اور ترقیوں کو اس کو نظرانداز کرنے کی اجازت دیتی ہیں۔

مندرجہ ذیل مواد میں ہم ای بک فارمیٹس کے ظہور کی تاریخ اور ان کے کام کی خصوصیات کے بارے میں کہانی جاری رکھیں گے۔

PS ONYX BOOX ریڈرز کے کئی سیٹ:



ماخذ: www.habr.com

نیا تبصرہ شامل کریں