Зашто слова нису у низу у ЕБЦДИЦ-у?

АСЦИИ стандард је усвојен 1963. године и сада ретко ко користи кодирање чијих се првих 128 знакова разликује од АСЦИИ. Међутим, до краја прошлог века активно се користио ЕБЦДИЦ – стандардно кодирање за ИБМ мејнфрејмове и њихове совјетске клонове ЕЦ рачунара. ЕБЦДИЦ остаје примарно кодирање у з/ОС, стандардном оперативном систему за модерне ИБМ З главне рачунаре.

Оно што вам одмах упада у очи када гледате ЕБЦДИЦ је да слова нису у низу: између I и J и између R и S било је неискоришћених позиција (на ЕС рачунару за ове интервале дистрибуиран ћирилични знакови). Ко би помислио да кодира слова са неједнаким размацима између суседних слова?

Зашто слова нису у низу у ЕБЦДИЦ-у?

Сам назив ЕБЦДИЦ („Ектендед БЦДИЦ“) наговештава да ово кодирање – за разлику од АСЦИИ – није креирано од нуле, већ на основу шестобитног БЦДИЦ кодирања, које се користи од ИБМ 704 (КСНУМКС):

Зашто слова нису у низу у ЕБЦДИЦ-у?

Не постоји непосредна компатибилност унатраг: згодна карактеристика БЦДИЦ-а која је изгубљена у преласку на ЕБЦДИЦ била је да су бројеви 0-9 одговарају кодовима 0-9. Међутим, постоје празнине од седам кодова између I и J а у осам кодова између R и S већ су били у БЦДИЦ-у. Одакле долазе?

Историја (Е)БЦДИЦ-а почиње истовремено са историјом ИБМ-а – много пре електронских рачунара. ИБМ је настао као резултат спајања четири компаније, од којих је технолошки најнапреднија била Табулатинг Мацхине Цомпани, коју је 1896. основао Херман Холерит, проналазач табулатор. Први табулатори су једноставно бројали број бушених карата на одређеној локацији; али је 1905. Холерит је започео производњу децималан табулатори. Свака карта за децимални табулатор састојала се од поља произвољне дужине, а бројеви уписани у овим пољима у уобичајеном децималном облику су збрајани по целом шпилу. Подела карте на поља одређена је повезивањем жица на патцх панелу табулатора. На пример, на овој Холеритх бушеној картици, ускладиштено у Конгресној библиотеци, број 23456789012345678 је јасно утиснут, непознат као подељен на поља:

Зашто слова нису у низу у ЕБЦДИЦ-у?

Најпажљивији су можда приметили да на Холеритовој карти има 12 редова за рупе, иако је десет довољно за бројеве; а у БЦДИЦ-у, за сваку вредност најзначајнија два бита, користи се само 12 кодова од 16 могућих.

Наравно, ово није случајно. У почетку је Холерит наменио додатне редове за „посебне оцене“ које се нису сабирали, већ једноставно бројали - као у првим табулаторима. (Данас бисмо их назвали „битна поља“.) Осим тога, међу „посебним ознакама“ било је могуће поставити групне индикаторе: ако је за табелирање потребно не само коначне суме, већ и средње, онда би табулатор стао када би детектовао је промену у било ком од групних индикатора, а оператер је морао да препише подзбирове са дигиталних табли на папир, ресетује таблу и настави са табеларно. На пример, када се рачуна рачуноводствена стања, група картица може одговарати једном датуму или једној другој страни.

До 1920. године, када је Холерит већ био у пензији, у употребу су ушли „табулатори за куцање“, који су били повезани на телетип и могли су сами да штампају међузбирове без потребе за интервенцијом оператера. Сада је било тешко одредити на шта се односи сваки од штампаних бројева. Године 1931. ИБМ је одлучио да користи „специјалне ознаке“ за означавање слова: ознака у 12. реду означавала је слово од A до I, у 11. - од J до R, на нули - од S до Z. Нови „табулатор абецеде“ могао би да одштампа назив сваке групе картица заједно са међузбировима; у овом случају, непрекинута колона се претворила у размак између знакова. Имајте на уму да S означен је комбинацијом рупа 0+2, а комбинација 0+1 првобитно није коришћена из страха да би две рупе једна поред друге у истој колони изазвале механичке проблеме у читачу.

Зашто слова нису у низу у ЕБЦДИЦ-у?

Сада можете погледати БЦДИЦ табелу из мало другачијег угла:

Зашто слова нису у низу у ЕБЦДИЦ-у?

Осим што су 0 и размак обрнути, два најзначајнија бита дефинишу „посебну ознаку“ која је укуцана у бушену картицу за одговарајући знак од 1931. године; а најмање значајна четири бита одређују цифру која је укуцана у главни део картице. Подршка за симболе & - / је додат у ИБМ табулаторе 1930-их, а БЦДИЦ кодирање ових знакова одговара комбинацијама рупа које су избушене за њих. Када је била потребна подршка за још већи број знакова, ред 8 је пробушен као додатна „посебна ознака“ - тако је у једној колони могло бити до три рупе. Овај формат бушених картица остао је практично непромењен до краја века. У СССР-у су напустили ИБМ-ова латинична и интерпункцијска кодирања, а за ћирилична слова су пробушили неколико „посебних ознака“ одједном у редовима 12, 11, 0 - не ограничавајући се на три рупе у једној колони.

Када је створен рачунар ИБМ 704, нису дуго размишљали о кодирању знакова за њега: узели су кодирање које се већ користило у бушеним картицама у то време и само га „ставили на његово место“. Године 0, током преласка са БЦДИЦ на ЕБЦДИЦ, четири бита нижег реда сваког симбола су остављена непромењена, иако су битови високог реда мало промешани. Дакле, формат бушене картице коју је Холерит одабрао почетком прошлог века утицао је на архитектуру свих ИБМ рачунара, до и укључујући ИБМ З.

Извор: ввв.хабр.цом

Додај коментар