ఇ-బుక్స్ మరియు వాటి ఫార్మాట్‌లు: DjVu - దాని చరిత్ర, లాభాలు, నష్టాలు మరియు లక్షణాలు

70 ల ప్రారంభంలో, అమెరికన్ రచయిత మైఖేల్ హార్ట్ నిర్వహించాడు పొందడానికి యూనివర్శిటీ ఆఫ్ ఇల్లినాయిస్‌లో ఇన్‌స్టాల్ చేయబడిన జిరాక్స్ సిగ్మా 5 కంప్యూటర్‌కు అపరిమిత యాక్సెస్. యంత్రం యొక్క వనరులను బాగా ఉపయోగించుకోవడానికి, అతను US స్వాతంత్ర్య ప్రకటనను పునర్ముద్రిస్తూ మొదటి ఎలక్ట్రానిక్ పుస్తకాన్ని రూపొందించాలని నిర్ణయించుకున్నాడు.

నేడు, డిజిటల్ సాహిత్యం విస్తృతంగా వ్యాపించింది, పోర్టబుల్ పరికరాల (స్మార్ట్‌ఫోన్‌లు, ఇ-రీడర్‌లు, ల్యాప్‌టాప్‌లు) అభివృద్ధికి కృతజ్ఞతలు. ఇది పెద్ద సంఖ్యలో ఇ-బుక్ ఫార్మాట్‌ల ఆవిర్భావానికి దారితీసింది. వారి లక్షణాలను అర్థం చేసుకోవడానికి ప్రయత్నిద్దాం మరియు వాటిలో అత్యంత ప్రాచుర్యం పొందిన చరిత్రను తెలియజేయండి - DjVu ఆకృతితో ప్రారంభిద్దాం.

ఇ-బుక్స్ మరియు వాటి ఫార్మాట్‌లు: DjVu - దాని చరిత్ర, లాభాలు, నష్టాలు మరియు లక్షణాలు
/flickr/ లేన్ పియర్మాన్ / CC

ఫార్మాట్ యొక్క ఆవిర్భావం

DjVu 1996లో AT&T ల్యాబ్స్ ద్వారా ఒక ప్రయోజనంతో అభివృద్ధి చేయబడింది - వెబ్ డెవలపర్‌లకు ఇంటర్నెట్‌లో అధిక-రిజల్యూషన్ చిత్రాలను పంపిణీ చేయడానికి ఒక సాధనాన్ని అందించడం.

వాస్తవం ఏమిటంటే, ఆ సమయంలో మొత్తం సమాచారంలో 90% ఇప్పటికీ ఉంది నిల్వ చేయబడింది కాగితంపై, మరియు చాలా ముఖ్యమైన పత్రాలలో రంగు చిత్రాలు మరియు ఛాయాచిత్రాలు ఉన్నాయి. టెక్స్ట్ యొక్క రీడబిలిటీని మరియు చిత్రాల నాణ్యతను నిర్వహించడానికి, అధిక-రిజల్యూషన్ స్కాన్‌లను చేయడం అవసరం.

క్లాసిక్ వెబ్ ఫార్మాట్‌లు - JPEG, GIF మరియు PNG - అటువంటి చిత్రాలతో పని చేయడం సాధ్యం చేసింది, కానీ వాల్యూమ్ ఖర్చుతో. JPEG విషయంలో, తద్వారా టెక్స్ట్ చదివారు మానిటర్ స్క్రీన్‌పై, నేను 300 dpi రిజల్యూషన్‌తో పత్రాన్ని స్కాన్ చేయాల్సి వచ్చింది. మ్యాగజైన్ యొక్క రంగు పేజీ 500 KB ఆక్రమించింది. ఇంటర్నెట్ నుండి ఈ పరిమాణంలోని ఫైళ్లను డౌన్‌లోడ్ చేయడం ఆ సమయంలో చాలా శ్రమతో కూడుకున్న ప్రక్రియ.

ప్రత్యామ్నాయం OCR సాంకేతికతలను ఉపయోగించి కాగితపు పత్రాలను డిజిటలైజ్ చేయడం, కానీ 20 సంవత్సరాల క్రితం వాటి ఖచ్చితత్వం ఆదర్శానికి దూరంగా ఉంది - ప్రాసెస్ చేసిన తర్వాత, తుది ఫలితం చేతితో తీవ్రంగా సవరించబడాలి. అదే సమయంలో, గ్రాఫిక్స్ మరియు చిత్రాలు "అతిగా" ఉన్నాయి. మరియు స్కాన్ చేసిన చిత్రాన్ని టెక్స్ట్ డాక్యుమెంట్‌లో పొందుపరచడం సాధ్యమైనప్పటికీ, కొన్ని దృశ్యమాన వివరాలు పోయాయి, ఉదాహరణకు, కాగితం రంగు, దాని ఆకృతి మరియు ఇవి చారిత్రక పత్రాలలో ముఖ్యమైన భాగాలు.

ఈ సమస్యలను పరిష్కరించడానికి, AT&T DjVuని అభివృద్ధి చేసింది. ఇది 300 dpi నుండి 40-60 KB రిజల్యూషన్‌తో, 25 MB అసలు పరిమాణంతో స్కాన్ చేసిన రంగు పత్రాలను కుదించడం సాధ్యపడింది. DjVu నలుపు మరియు తెలుపు పేజీల పరిమాణాన్ని 10-30 KBకి తగ్గించింది.

DjVu పత్రాలను ఎలా కుదిస్తుంది

DjVu స్కాన్ చేసిన పేపర్ డాక్యుమెంట్‌లు మరియు PDF వంటి ఇతర డిజిటల్ ఫార్మాట్‌లతో పని చేయవచ్చు. DjVu ఎలా పని చేస్తుంది అబద్ధాలు చిత్రాన్ని మూడు భాగాలుగా విభజించే సాంకేతికత: ముందుభాగం, నేపథ్యం మరియు నలుపు మరియు తెలుపు (బిట్) ముసుగు.

ముసుగు అసలు ఫైల్ యొక్క రిజల్యూషన్ వద్ద సేవ్ చేయబడుతుంది మరియు ఇది కలిగి టెక్స్ట్ యొక్క చిత్రం మరియు ఇతర స్పష్టమైన వివరాలు - చక్కటి గీతలు మరియు రేఖాచిత్రాలు - అలాగే విభిన్న చిత్రాలు.

ఇది ఫైన్ లైన్‌లు మరియు అక్షరాల రూపురేఖలను పదునుగా ఉంచడానికి 300 dpi రిజల్యూషన్‌ను కలిగి ఉంది మరియు JB2 అల్గారిథమ్‌ని ఉపయోగించి కంప్రెస్ చేయబడింది, ఇది ఫ్యాక్సింగ్ కోసం AT&T యొక్క JBIG2 అల్గారిథమ్ యొక్క వైవిధ్యం. JB2 యొక్క లక్షణం ఇది అది పేజీలో నకిలీ అక్షరాల కోసం వెతుకుతుంది మరియు వాటి చిత్రాన్ని ఒక్కసారి మాత్రమే సేవ్ చేస్తుంది. అందువల్ల, బహుళ-పేజీ పత్రాలలో, ప్రతి కొన్ని వరుస పేజీలు ఒక సాధారణ “నిఘంటువు”ని పంచుకుంటాయి.

నేపథ్యం పేజీ యొక్క ఆకృతిని మరియు దృష్టాంతాలను కలిగి ఉంది మరియు దాని రిజల్యూషన్ మాస్క్ కంటే తక్కువగా ఉంటుంది. నష్టం లేని నేపథ్యం 100 dpi వద్ద సేవ్ చేయబడింది.

ముందువైపు దుకాణాలు ముసుగు గురించి రంగు సమాచారం, మరియు దాని రిజల్యూషన్ సాధారణంగా మరింత తగ్గించబడుతుంది, ఎందుకంటే చాలా సందర్భాలలో వచన రంగు నలుపు మరియు ఒక ముద్రిత అక్షరానికి ఒకే విధంగా ఉంటుంది. ముందుభాగం మరియు నేపథ్యాన్ని కుదించడానికి ఉపయోగిస్తారు వేవ్లెట్ కుదింపు.

DjVu డాక్యుమెంట్‌ని సృష్టించే చివరి దశ ఎంట్రోపీ ఎన్‌కోడింగ్, అడాప్టివ్ అరిథ్‌మెటిక్ ఎన్‌కోడర్ ఒకేలా అక్షరాల సీక్వెన్స్‌లను బైనరీ విలువగా మార్చినప్పుడు.

ఫార్మాట్ యొక్క ప్రయోజనాలు

DjVu యొక్క పని నిలుపుకున్న డిజిటల్ రూపంలో పేపర్ డాక్యుమెంట్ యొక్క "గుణాలు", బలహీనమైన కంప్యూటర్లు కూడా అలాంటి పత్రాలతో పని చేయడానికి వీలు కల్పిస్తాయి. అందువల్ల, DjVu ఫైల్‌లను వీక్షించే సాఫ్ట్‌వేర్ "వేగవంతమైన రెండరింగ్" సామర్థ్యాన్ని కలిగి ఉంటుంది. ఆమె జ్ఞాపకార్థం ధన్యవాదాలు లోడ్ DjVu పేజీలోని ఆ భాగాన్ని మాత్రమే స్క్రీన్‌పై ప్రదర్శించాలి.

ఇది “అన్‌డౌన్‌లోడ్ చేయని” ఫైల్‌లను, అంటే బహుళ-పేజీ DjVu పత్రం యొక్క వ్యక్తిగత పేజీలను వీక్షించడం కూడా సాధ్యం చేస్తుంది. ఈ సందర్భంలో, ఫైల్ డౌన్‌లోడ్ చేయబడినప్పుడు (JPEGలో వలె) భాగాలు “కనిపిస్తాయి” అని అనిపించినప్పుడు చిత్ర వివరాల యొక్క ప్రగతిశీల డ్రాయింగ్ ఉపయోగించబడుతుంది.

20 సంవత్సరాల క్రితం, ఈ ఆకృతిని ప్రవేశపెట్టినప్పుడు, పేజీ మూడు దశల్లో లోడ్ చేయబడింది: మొదట టెక్స్ట్ భాగం లోడ్ చేయబడింది, కొన్ని సెకన్ల తర్వాత చిత్రాల మొదటి సంస్కరణలు మరియు నేపథ్యం లోడ్ చేయబడ్డాయి. తరువాత, పుస్తకం యొక్క మొత్తం పేజీ "కనిపించింది."

మూడు-స్థాయి నిర్మాణం యొక్క ఉనికి కూడా స్కాన్ చేసిన పుస్తకాల ద్వారా శోధించడానికి మిమ్మల్ని అనుమతిస్తుంది (ప్రత్యేక టెక్స్ట్ లేయర్ ఉన్నందున). సాంకేతిక సాహిత్యం మరియు రిఫరెన్స్ పుస్తకాలతో పనిచేసేటప్పుడు ఇది సౌకర్యవంతంగా మారింది, కాబట్టి DjVu అనేక శాస్త్రీయ పుస్తకాల లైబ్రరీలకు ఆధారం అయ్యింది. ఉదాహరణకు, 2002 లో అతను ఎంపికయ్యాడు ఇంటర్నెట్ ఆర్కైవ్ ఓపెన్ సోర్స్‌ల నుండి స్కాన్ చేసిన పుస్తకాలను భద్రపరిచే ప్రాజెక్ట్ కోసం ఫార్మాట్‌లలో ఒకటిగా (TIFF మరియు PDFతో పాటు).

ఫార్మాట్ యొక్క ప్రతికూలతలు

అయితే, అన్ని టెక్నాలజీల వలె, DjVu దాని లోపాలను కలిగి ఉంది. ఉదాహరణకు, పుస్తకాల స్కాన్‌లను DjVu ఫార్మాట్‌లోకి ఎన్‌కోడ్ చేస్తున్నప్పుడు, డాక్యుమెంట్‌లోని కొన్ని అక్షరాలు కనిపించే విధంగా ఉండే ఇతర వాటితో భర్తీ చేయబడవచ్చు. ఇది చాలా తరచుగా "i" మరియు "n" అక్షరాలతో జరుగుతుంది, అందుకే ఈ సమస్య నేను అందుకున్న పేరు "యిన్ సమస్య". ఇది టెక్స్ట్ యొక్క భాషపై ఆధారపడి ఉండదు మరియు ఇతర విషయాలతోపాటు, సంఖ్యలు మరియు ఇతర చిన్న పునరావృత అక్షరాలను ప్రభావితం చేస్తుంది.

JB2 ఎన్‌కోడర్‌లో అక్షర వర్గీకరణ లోపాలు దీనికి కారణం. ఇది 10-20 ముక్కల సమూహాలుగా స్కాన్‌లను "విభజిస్తుంది" మరియు ప్రతి సమూహానికి సాధారణ చిహ్నాల నిఘంటువును ఏర్పరుస్తుంది. నిఘంటువు పేజీలు మరియు వాటి రూపానికి సంబంధించిన కోఆర్డినేట్‌లతో సాధారణ అక్షరాలు మరియు సంఖ్యల ఉదాహరణలను కలిగి ఉంది. మీరు DjVu పుస్తకాన్ని వీక్షించినప్పుడు, డిక్షనరీలోని అక్షరాలు సరైన ప్రదేశాల్లోకి చొప్పించబడతాయి.

ఇది DjVu ఫైల్ పరిమాణాన్ని తగ్గించడానికి మిమ్మల్ని అనుమతిస్తుంది, అయితే, రెండు అక్షరాల డిస్‌ప్లేలు దృశ్యమానంగా ఒకేలా ఉంటే, ఎన్‌కోడర్ వాటిని తికమక పెట్టవచ్చు లేదా అదే విధంగా పొరపాటు చేయవచ్చు. కొన్నిసార్లు ఇది సాంకేతిక పత్రంలో సూత్రాలకు నష్టం కలిగిస్తుంది. ఈ సమస్యను పరిష్కరించడానికి, మీరు కుదింపు అల్గారిథమ్‌లను వదిలివేయవచ్చు, అయితే ఇది పుస్తకం యొక్క డిజిటల్ కాపీ పరిమాణాన్ని పెంచుతుంది.

ఫార్మాట్ యొక్క మరొక ప్రతికూలత ఏమిటంటే, అనేక ఆధునిక ఆపరేటింగ్ సిస్టమ్‌లలో (మొబైల్ వాటితో సహా) డిఫాల్ట్‌గా దీనికి మద్దతు లేదు. అందువలన, దానితో పని చేయడానికి మీరు మూడవ పక్షాన్ని ఇన్స్టాల్ చేయాలి కార్యక్రమాలు, DjVuReader, WinDjView, Evince, మొదలైనవి అయితే, ఇక్కడ నేను కొన్ని ఎలక్ట్రానిక్ రీడర్‌లు (ఉదాహరణకు, ONYX BOOX) DjVu ఆకృతికి “బాక్స్ వెలుపల” మద్దతు ఇస్తాయని గమనించాలనుకుంటున్నాను - అవసరమైన అప్లికేషన్‌లు ఇప్పటికే అక్కడ ఇన్‌స్టాల్ చేయబడ్డాయి.

మార్గం ద్వారా, మేము Android ఆధారిత రీడర్‌ల కోసం మునుపటి వాటిలో ఇంకా ఏమి చేయవచ్చనే దాని గురించి మాట్లాడాము పదార్థాలు.

ఇ-బుక్స్ మరియు వాటి ఫార్మాట్‌లు: DjVu - దాని చరిత్ర, లాభాలు, నష్టాలు మరియు లక్షణాలు
రీడర్ ONYX BOOX Chronos

మొబైల్ పరికరాల యొక్క చిన్న స్క్రీన్‌లలో DjVu పత్రాలతో పని చేస్తున్నప్పుడు మరొక ఫార్మాట్ సమస్య కనిపిస్తుంది - స్మార్ట్‌ఫోన్‌లు, టాబ్లెట్‌లు, రీడర్‌లు. కొన్నిసార్లు DjVu ఫైల్‌లు పుస్తక వ్యాప్తి యొక్క స్కాన్ రూపంలో ప్రదర్శించబడతాయి మరియు వృత్తిపరమైన సాహిత్యం మరియు పని పత్రాలు తరచుగా A4 ఆకృతిలో ఉంటాయి, కాబట్టి మీరు సమాచారం కోసం చిత్రాన్ని "తరలించాలి".

అయితే, ఈ సమస్య కూడా పరిష్కరించబడుతుందని మేము గమనించాము. సులభమైన మార్గం, వాస్తవానికి, వేరే ఆకృతిలో పత్రం కోసం వెతకడం - కానీ ఈ ఎంపిక సాధ్యం కాకపోతే (ఉదాహరణకు, మీరు DjVu లో పెద్ద మొత్తంలో సాంకేతిక సాహిత్యంతో పని చేయాలి), అప్పుడు మీరు ఎలక్ట్రానిక్ రీడర్లను ఉపయోగించవచ్చు 9,7 నుండి 13,3 అంగుళాల వరకు పెద్ద వికర్ణంతో, అటువంటి పత్రాలతో పని చేయడానికి ప్రత్యేకంగా "అనుకూలమైనది".

ఉదాహరణకు, ONYX BOOX లైన్‌లో ఇటువంటి పరికరాలు ఉన్నాయి క్రోనోస్ и MAX 2 (మార్గం ద్వారా, మేము ఈ రీడర్ మోడల్ యొక్క సమీక్షను సిద్ధం చేసాము మరియు దానిని త్వరలో మా బ్లాగ్‌లో ప్రచురిస్తాము), మరియు కూడా గమనిక, ఇది 10,3 అంగుళాల వికర్ణం మరియు పెరిగిన రిజల్యూషన్‌తో E Ink Mobius కార్టా స్క్రీన్‌ను కలిగి ఉంది. ఇటువంటి పరికరాలు దృష్టాంతాల యొక్క అన్ని వివరాలను వాటి అసలు పరిమాణంలో ప్రశాంతంగా పరిశీలించడానికి మిమ్మల్ని అనుమతిస్తాయి మరియు విద్యా లేదా సాంకేతిక సాహిత్యాన్ని తరచుగా చదవవలసిన వారికి అనుకూలంగా ఉంటాయి. DjVu మరియు PDF ఫైల్‌లను వీక్షించడానికి ఉపయోగించబడుతుంది NEO రీడర్, ఇది డిజిటైజ్ చేయబడిన ఫాంట్‌ల కాంట్రాస్ట్ మరియు మందాన్ని సర్దుబాటు చేయడానికి మిమ్మల్ని అనుమతిస్తుంది.

ఫార్మాట్ యొక్క లోపాలు ఉన్నప్పటికీ, నేడు DjVu సాహిత్య రచనలను "సంరక్షించడానికి" అత్యంత ప్రజాదరణ పొందిన ఫార్మాట్లలో ఒకటిగా ఉంది. ఇది ఎక్కువగా అతను వాస్తవం కారణంగా ఉంది ఇది ఓపెన్, మరియు నేడు కొన్ని సాంకేతిక పరిమితులు ఆధునిక సాంకేతికతలు మరియు అభివృద్ధిని దాటవేయడానికి అనుమతిస్తాయి.

క్రింది పదార్థాలలో మేము ఇ-బుక్ ఫార్మాట్ల ఆవిర్భావం మరియు వారి పని యొక్క లక్షణాల చరిత్ర గురించి కథను కొనసాగిస్తాము.

PS అనేక సెట్లు ONYX BOOX రీడర్లు:



మూలం: www.habr.com

ఒక వ్యాఖ్యను జోడించండి