لماذا الحروف ليست متتالية في EBCDIC؟

تم اعتماد معيار ASCII في عام 1963، والآن نادرًا ما يستخدم أي شخص ترميزًا يختلف أول 128 حرفًا عنه عن ASCII. ومع ذلك، حتى نهاية القرن الماضي، تم استخدام EBCDIC بنشاط - الترميز القياسي لحواسيب IBM المركزية وأجهزة الكمبيوتر المستنسخة السوفيتية الخاصة بها. يظل EBCDIC هو التشفير الأساسي في z/OS، وهو نظام التشغيل القياسي لحواسيب IBM Z المركزية الحديثة.

ما يلفت انتباهك على الفور عند النظر إلى EBCDIC هو أن الحروف ليست متتالية: بين I и J وبين R и S كانت هناك مواضع غير مستخدمة (على كمبيوتر ES لهذه الفواصل الزمنية وزعت الأحرف السيريلية). من كان يظن أنه يمكن تشفير الحروف بمسافات غير متساوية بين الحروف المتجاورة؟

لماذا الحروف ليست متتالية في EBCDIC؟

يشير الاسم EBCDIC ("BCDIC الممتد") إلى أن هذا التشفير - على عكس ASCII - لم يتم إنشاؤه من الصفر، ولكن بناءً على تشفير BCDIC المكون من ستة بتات، والذي تم استخدامه منذ ذلك الحين. IBM 704 (1954):

لماذا الحروف ليست متتالية في EBCDIC؟

لا يوجد توافق فوري مع الإصدارات السابقة: إحدى الميزات الملائمة لـ BCDIC التي فُقدت أثناء الانتقال إلى EBCDIC هي أن الأرقام 0-9 تتوافق مع رموز 0-9. ومع ذلك، هناك فجوات من سبعة رموز بينهما I и J وفي ثمانية رموز بين R и S تم بالفعل إلى BCDIC. من أين أتوا؟

يبدأ تاريخ (E)BCDIC بالتزامن مع تاريخ شركة IBM - قبل فترة طويلة من ظهور أجهزة الكمبيوتر الإلكترونية. تأسست شركة IBM نتيجة اندماج أربع شركات، وكان أكثرها تقدمًا من الناحية التكنولوجية شركة Tabulation Machine Company، التي تأسست عام 1896 على يد هيرمان هوليريث، المخترع أداة جدولة. قامت أجهزة الجدولة الأولى ببساطة بإحصاء عدد البطاقات المثقوبة في مكان معين؛ ولكن في عام 1905 بدأ هوليريث الإنتاج عدد عشري أجهزة جدولة. تتكون كل بطاقة لأداة الجدولة العشرية من حقول ذات طول عشوائي، وتم جمع الأرقام المكتوبة في هذه الحقول بالشكل العشري المعتاد على المجموعة بأكملها. تم تحديد تقسيم الخريطة إلى حقول من خلال توصيل الأسلاك الموجودة على لوحة توصيل جهاز الجدولة. على سبيل المثال، على بطاقة هوليريث المثقوبة هذه، مخزن في مكتبة الكونغرس، الرقم 23456789012345678 مختوم بشكل واضح، غير معروف ومقسم إلى حقول:

لماذا الحروف ليست متتالية في EBCDIC؟

ربما لاحظ الأشخاص الأكثر انتباهاً أن هناك 12 صفًا للثقوب على خريطة هوليريث، على الرغم من أن عشرة صفوف كافية للأرقام؛ وفي BCDIC، لكل قيمة من البتتين الأكثر أهمية، يتم استخدام 12 رمزًا فقط من أصل 16 رمزًا ممكنًا.

وبطبيعة الحال، هذه ليست مصادفة. في البداية، قصد هوليريث صفوفًا إضافية لـ "العلامات الخاصة" التي لم تتم إضافتها، ولكن تم حسابها ببساطة - كما في أدوات الجدولة الأولى. (اليوم نسميها "حقول البت".) بالإضافة إلى ذلك، من بين "العلامات الخاصة" كان من الممكن تعيين مؤشرات المجموعة: إذا كانت الجدولة لا تتطلب المجاميع النهائية فحسب، بل تتطلب أيضًا مبالغ وسيطة، فسيتوقف الجدول عندما اكتشف تغييرًا في أي من مؤشرات المجموعة، وكان على المشغل إعادة كتابة المجاميع الفرعية من اللوحات الرقمية على الورق، وإعادة ضبط اللوحة، واستئناف الجدولة. على سبيل المثال، عند حساب الأرصدة المحاسبية، يمكن لمجموعة من البطاقات أن تتوافق مع تاريخ واحد أو طرف مقابل واحد.

بحلول عام 1920، عندما كان هوليريث قد تقاعد بالفعل، بدأ استخدام "أجهزة جدولة الكتابة"، والتي كانت متصلة بالمُبرِقة المبرقة ويمكنها طباعة الإجماليات الفرعية بنفسها دون الحاجة إلى تدخل المشغل. وكانت الصعوبة الآن هي تحديد ما يشير إليه كل رقم من الأرقام المطبوعة. في عام 1931، قررت شركة IBM استخدام "علامات خاصة" للإشارة إلى الحروف: كانت العلامة الموجودة في الصف الثاني عشر تشير إلى الحرف من A إلى Iفي الحادي عشر - من J إلى Rعند الصفر - من S إلى Z. يمكن لـ "أداة جدولة الحروف الأبجدية" الجديدة طباعة اسم كل مجموعة من البطاقات بالإضافة إلى الإجماليات الفرعية؛ في هذه الحالة، تحول العمود غير المنقطع إلى مسافة بين الأحرف. يرجى ملاحظة ذلك S تم تحديده بواسطة مجموعة الفتحات 0+2، ولم يتم استخدام مجموعة 0+1 في الأصل خوفًا من أن يؤدي وجود ثقبين بجوار بعضهما البعض في نفس العمود إلى حدوث مشاكل ميكانيكية في القارئ.

لماذا الحروف ليست متتالية في EBCDIC؟

يمكنك الآن إلقاء نظرة على جدول BCDIC من زاوية مختلفة قليلًا:

لماذا الحروف ليست متتالية في EBCDIC؟

باستثناء أنه تم عكس 0 والمسافة، فإن البتتين الأكثر أهمية تحدد "العلامة الخاصة" التي تم ثقبها في البطاقة المثقوبة للشخصية المقابلة منذ عام 1931؛ وتحدد البتات الأربعة الأقل أهمية الرقم المثقوب في الجزء الرئيسي من البطاقة. دعم الرمز & - / تمت إضافتها إلى أجهزة جدولة IBM في ثلاثينيات القرن العشرين، وكان تشفير BCDIC لهذه الأحرف يتوافق مع مجموعات الفتحات المثقبة لها. عند الحاجة إلى دعم عدد أكبر من الأحرف، تم ثقب الصف 1930 باعتباره "علامة خاصة" إضافية - وبالتالي، يمكن أن يكون هناك ما يصل إلى ثلاثة ثقوب في عمود واحد. ظل هذا الشكل من البطاقات المثقوبة دون تغيير تقريبًا حتى نهاية القرن. في اتحاد الجمهوريات الاشتراكية السوفياتية، تركوا الترميزات اللاتينية وعلامات الترقيم الخاصة بشركة IBM، وبالنسبة للأحرف السيريلية قاموا بضرب عدة "علامات خاصة" مرة واحدة في الصفوف 8، 12، 11 - لا يقتصر على ثلاثة ثقوب في عمود واحد.

عندما تم إنشاء جهاز الكمبيوتر IBM 704، لم يفكروا طويلاً في تشفير الأحرف الخاصة به: لقد أخذوا التشفير المستخدم بالفعل في البطاقات المثقوبة في ذلك الوقت، واكتفوا "بوضعه في مكانه". في عام 0، أثناء الانتقال من BCDIC إلى EBCDIC، تُركت البتات الأربعة ذات الترتيب المنخفض من كل رمز دون تغيير، على الرغم من تعديل البتات ذات الترتيب العالي قليلاً. وهكذا، فإن تنسيق البطاقة المثقبة الذي اختاره هوليريث في بداية القرن الماضي أثر على بنية جميع أجهزة كمبيوتر IBM، بما في ذلك جهاز IBM Z.

المصدر: www.habr.com

إضافة تعليق