الكتب الإلكترونية وتنسيقاتها: FB2 و FB3 - تاريخ وإيجابيات وسلبيات ومبادئ العمل

تحدثنا عنها في المقال السابق مميزات تنسيق DjVu. قررنا اليوم التركيز على تنسيق FictionBook2، المعروف باسم FB2، و"خلفه" FB3.

الكتب الإلكترونية وتنسيقاتها: FB2 و FB3 - تاريخ وإيجابيات وسلبيات ومبادئ العمل
/ فليكر / جوديت كلاين / CC

مظهر التنسيق

في منتصف التسعينيات، المتحمسين بدأنا رقمنة الكتب السوفيتية. لقد ترجموا وحفظوا الأدب في مجموعة واسعة من الأشكال. واحدة من المكتبات الأولى في Runet - مكتبة مكسيم موشكوف - استخدم ملف نصي منسق (TXT).

تم الاختيار لصالحه نظرًا لمقاومته لفساد البايت وتعدد الاستخدامات - يتم فتح TXT على أي نظام تشغيل. ومع ذلك فهو جعل الأمر صعبا معالجة المعلومات النصية المخزنة. على سبيل المثال، للانتقال إلى سطر الألف، كان لا بد من معالجة 999 سطرًا يسبقه. الكتب أيضا مخزن في مستندات Word وPDF - كان من الصعب تحويل الأخير إلى تنسيقات أخرى، وفتحت أجهزة الكمبيوتر الضعيفة و عرض وثائق PDF مع التأخير.

تم استخدام HTML أيضًا "لتخزين" الأدب الإلكتروني. لقد جعل الفهرسة والتحويل إلى تنسيقات أخرى وإنشاء المستندات (وضع علامات على النص) أسهل، لكنه أدخل عيوبه الخاصة. وكان من أهمها "غموض» قياسي: سمح ببعض الحريات عند كتابة العلامات. كان لا بد من إغلاق بعضها، والبعض الآخر (على سبيل المثال، ) - ليست هناك حاجة لإغلاقه. يمكن أن تحتوي العلامات نفسها على ترتيب تداخل عشوائي.

وعلى الرغم من عدم تشجيع مثل هذا العمل مع الملفات - فقد اعتبرت هذه المستندات غير صحيحة - إلا أن المعيار يتطلب من القراء محاولة عرض المحتوى. وهنا نشأت الصعوبات، لأنه في كل تطبيق تم تنفيذ عملية "التخمين" بطريقتها الخاصة. وفي الوقت نفسه، أصبحت أجهزة القراءة والتطبيقات المتوفرة في السوق في ذلك الوقت يفهم واحد أو اثنين من التنسيقات المتخصصة. إذا كان الكتاب متاحًا بتنسيق واحد، فيجب إعادة تنسيقه حتى يمكن قراءته. وكان الهدف منه حل كل هذه العيوب كتاب الخيال2، أو FB2، الذي تولى "التمشيط" الأولي للنص والتحويل.

لاحظ أن التنسيق كان له نسخته الأولى - كتاب الخيال1 - ومع ذلك، فهو كان تجريبيًا فقط بطبيعته، ولم يدم طويلاً، وغير مدعوم حاليًا وغير متوافق مع الإصدارات السابقة. لذلك، غالبا ما يعني FictionBook "خليفة" - تنسيق FB2.

تم إنشاء FB2 من قبل مجموعة من المطورين بقيادة ديمتري جريبوفوهو المدير الفني لشركة اللترات، وميخائيل ماتسنيف مبتكر قارئ هالي. يعتمد التنسيق على XML، الذي ينظم العمل مع العلامات غير المغلقة والمتداخلة بشكل أكثر صرامة من HTML. يرافق مستند XML ما يسمى بمخطط XML. مخطط XML هو ملف خاص يحتوي على جميع العلامات ويصف قواعد استخدامها (التسلسل، والتداخل، والإلزامي والاختياري، وما إلى ذلك). في FictionBook، يوجد الرسم التخطيطي في الملف FictionBook2.xsd. يمكن العثور على مثال لمخطط XML على صلة (يتم استخدامه بواسطة متجر الكتب الإلكترونية لتر).

هيكل وثيقة FB2

النص في الوثيقة يتم تخزين في العلامات الخاصة - عناصر أنواع الفقرة: , و . هناك أيضا عنصر ، الذي لا يحتوي على محتوى ويستخدم لإدراج الفجوات.

تبدأ كافة المستندات بعلامة الجذر ، والتي قد تظهر أدناه , , و .

بطاقة شعار يحتوي على أوراق الأنماط لتسهيل التحويل إلى تنسيقات أخرى. في كذبة مشفرة باستخدام base64 البيانات التي قد تكون مطلوبة لتقديم الوثيقة.

عنصر يحتوي على جميع المعلومات الضرورية حول الكتاب: نوع العمل، قائمة المؤلفين (الاسم الكامل، عنوان البريد الإلكتروني والموقع الإلكتروني)، العنوان، الكتلة بالكلمات الرئيسية، التعليق التوضيحي. وقد يحتوي أيضًا على معلومات حول التغييرات التي تم إجراؤها على المستند ومعلومات حول ناشر الكتاب إذا تم نشره ورقيًا.

هذا ما يبدو عليه جزء من الكتلة في إدخال FictionBook لـ أعمال "دراسة في اللون القرمزي" بقلم آرثر كونان دويل، مأخوذة من مشروع جوتنبرج:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

المكون الرئيسي لمستند FictionBook هو . أنه يحتوي على نص الكتاب نفسه. يمكن أن يكون هناك العديد من هذه العلامات في جميع أنحاء المستند - يتم استخدام كتل إضافية لتخزين الحواشي السفلية والتعليقات والملاحظات.

يوفر FictionBook أيضًا عدة علامات للعمل مع الارتباطات التشعبية. وهي تعتمد على المواصفات إكسلينك، التي طورها الكونسورتيوم W3C خصيصًا لإنشاء روابط بين الموارد المختلفة في مستندات XML.

مزايا التنسيق

يتضمن معيار FB2 فقط الحد الأدنى المطلوب من مجموعة العلامات (كافية "لتصميم" الخيال)، مما يبسط عملية معالجتها من قبل القراء. علاوة على ذلك، في حالة التشغيل المباشر للقارئ بتنسيق FB، يكون لدى المستخدم الفرصة لتخصيص جميع معلمات العرض تقريبًا.

يتيح لك الهيكل الصارم للمستند أتمتة عملية التحويل من تنسيق FB إلى أي تنسيق آخر. نفس الهيكل يجعل من الممكن العمل مع العناصر الفردية للمستندات - إعداد المرشحات حسب مؤلفي الكتب، والعنوان، والنوع، وما إلى ذلك. ولهذا السبب، اكتسب تنسيق FB2 شعبية في Runet، ليصبح المعيار الافتراضي في المكتبات والمكتبات الإلكترونية الروسية في بلدان رابطة الدول المستقلة.

عيوب التنسيق

إن بساطة تنسيق FB2 لها مميزاتها وعيوبها في نفس الوقت. وهذا يحد من وظيفة تخطيط النص المعقد (على سبيل المثال، الملاحظات الموجودة في الهوامش). لا يحتوي على رسومات متجهة أو دعم للقوائم المرقمة. لهذا السبب التنسيق ليست مناسبة جدا للكتب المدرسية والكتب المرجعية والأدب الفني (يتحدث اسم التنسيق عن هذا - كتاب خيالي، أو "كتاب خيالي").

في الوقت نفسه، من أجل عرض الحد الأدنى من المعلومات حول الكتاب - العنوان والمؤلف والغلاف - يحتاج البرنامج إلى معالجة مستند XML بالكامل تقريبًا. وذلك لأن البيانات الوصفية تأتي في بداية النص والصور تأتي في النهاية.

FB3 - تطوير التنسيق

نظرًا لزيادة متطلبات تنسيق نصوص الكتب (ومن أجل التخفيف من بعض عيوب FB2)، بدأ غريبوف العمل على تنسيق FB3. توقف التطوير لاحقًا، لكنه كان كذلك في عام 2014 تم استئنافه.

وفقًا للمؤلفين، فقد درسوا الاحتياجات الحقيقية عند نشر الأدبيات الفنية، ونظروا في الكتب المدرسية والكتب المرجعية والأدلة الإرشادية وحددوا مجموعة أكثر تحديدًا من العلامات التي من شأنها أن تسمح بعرض أي كتاب.

في المواصفات الجديدة، يعد تنسيق FictionBook عبارة عن أرشيف مضغوط يتم فيه تخزين البيانات الوصفية والصور والنصوص كملفات منفصلة. تم تحديد متطلبات تنسيق الملف المضغوط واصطلاحات تنظيمه في المعيار ECMA-376، الذي يحدد Open XML.

تم إجراء عدد من التحسينات المتعلقة بالتنسيق (التباعد والتسطير) وتمت إضافة كائن جديد - "كتلة" - يقوم بتنسيق جزء تعسفي من الكتاب على شكل رباعي الزوايا ويمكن تضمينه في النص مع غلاف. يوجد الآن دعم للقوائم المرقمة والتعداد النقطي.

يتم توزيع FB3 بموجب ترخيص مجاني وهو مفتوح المصدر، لذا فإن جميع الأدوات المساعدة متاحة للناشرين والمستخدمين: المحولات، والمحررين السحابيين، والقراء. حاضِر نص شكل، قارئ и المحرر يمكن العثور عليها في مستودع GitHub الخاص بالمشروع.

بشكل عام، لا يزال FictionBook3 أقل انتشارًا من أخيه الأكبر، لكن العديد من المكتبات الإلكترونية تقدم بالفعل كتبًا بهذا التنسيق. وأعلنت الشركة قبل عامين عن عزمها نقل كتالوجها بالكامل إلى تنسيق جديد. يدعم بعض القراء بالفعل جميع وظائف FB3 الضرورية. على سبيل المثال، يمكن لجميع الموديلات الحديثة من قارئات ONYX العمل بهذا التنسيق خارج الصندوق، على سبيل المثال، داروين 3 أو كليوباترا 3.

الكتب الإلكترونية وتنسيقاتها: FB2 و FB3 - تاريخ وإيجابيات وسلبيات ومبادئ العمل
/ أونيكس بوكس ​​كليوباترا 3

سيؤدي التوزيع الأوسع لـ FictionBook3 إلى إنشاء نظام بيئي الموجهة للعمل بشكل كامل وفعال مع النص على أي جهاز بموارد محدودة: أبيض وأسود أو شاشة صغيرة، وذاكرة منخفضة، وما إلى ذلك. وفقًا للمطورين، سيكون الكتاب بمجرد وضعه مناسبًا قدر الإمكان في أي بيئة.

ملاحظة: نلفت انتباهكم إلى العديد من التقييمات لقراء ONYX BOOX:



المصدر: www.habr.com

إضافة تعليق