کتاب های الکترونیکی و فرمت های آنها: FB2 و FB3 - تاریخچه، مزایا، معایب و اصول کار

در مقاله قبلی که در مورد آن صحبت کردیم ویژگی های فرمت DjVu. امروز تصمیم گرفتیم بر روی قالب FictionBook2 که بیشتر با نام FB2 شناخته می شود و "جانشین" آن FB3 تمرکز کنیم.

کتاب های الکترونیکی و فرمت های آنها: FB2 و FB3 - تاریخچه، مزایا، معایب و اصول کار
/flickr/ جودیت کلاین / CC

ظاهر قالب

در اواسط دهه 90، علاقه مندان شروع کرده اند دیجیتالی کردن کتاب های شوروی آنها ادبیات را در قالب های مختلف ترجمه و حفظ کردند. یکی از اولین کتابخانه ها در Runet - کتابخانه ماکسیم مشکوف - از یک فایل متنی فرمت شده (TXT) استفاده کرد.

این انتخاب به دلیل مقاومت در برابر فساد بایت و تطبیق پذیری به نفع آن انجام شد - TXT روی هر سیستم عاملی باز می شود. با این حال، او آن را دشوار کرد پردازش اطلاعات متنی ذخیره شده به عنوان مثال، برای انتقال به خط هزارم، 999 خط قبل از آن باید پردازش شود. کتاب ها هم ذخیره شده است در اسناد Word و PDF - تبدیل دومی به فرمت های دیگر دشوار بود و رایانه های ضعیف باز شدند و نمایش داده اسناد PDF با تاخیر.

HTML همچنین برای "ذخیره" ادبیات الکترونیکی استفاده شد. ایندکس کردن، تبدیل به فرمت‌های دیگر و ایجاد سند (برچسب کردن متن) را آسان‌تر کرد، اما کاستی‌های خود را معرفی کرد. یکی از مهمترین آنها این بودابهام» استاندارد: آزادی های خاصی را هنگام نوشتن برچسب ها مجاز می کند. برخی از آنها باید بسته می شدند، برخی دیگر (به عنوان مثال، ) - نیازی به بستن آن نبود. خود تگ ها می توانند یک ترتیب تودرتو دلخواه داشته باشند.

و اگرچه چنین کار با پرونده ها تشویق نمی شد - چنین اسنادی نادرست در نظر گرفته می شدند - استاندارد از خوانندگان می خواست که سعی کنند محتوا را نمایش دهند. اینجاست که مشکلات به وجود آمد، زیرا در هر برنامه فرآیند "حدس زدن" به روش خود اجرا شد. در عین حال، دستگاه های خواندن و برنامه های کاربردی موجود در بازار در آن زمان درک کرد یک یا دو فرمت تخصصی اگر کتابی در یک قالب موجود بود، برای خواندن باید دوباره قالب بندی می شد. قرار بود همه این کاستی ها برطرف شود کتاب داستانی 2، یا FB2، که "شانه کردن" اولیه متن و تبدیل را بر عهده گرفت.

توجه داشته باشید که فرمت اولین نسخه خود را داشت - کتاب داستانی 1 - با این حال، ماهیت آن فقط تجربی بود، مدت زیادی دوام نیاورد، در حال حاضر پشتیبانی نمی شود و سازگار با عقب نیست. بنابراین، FictionBook اغلب به معنای "جانشین" آن است - فرمت FB2.

FB2 توسط گروهی از توسعه دهندگان به رهبری ایجاد شد دیمیتری گریبوف، که مدیر فنی شرکت لیتر است و میخائیل ماتسنیف، خالق Haali Reader. این قالب مبتنی بر XML است، که کار با برچسب‌های بسته و تودرتو را دقیق‌تر از HTML تنظیم می‌کند. یک سند XML با یک طرح به اصطلاح XML همراه است. طرحواره XML یک فایل ویژه است که شامل تمام تگ ها و تشریح قوانین استفاده از آنها (توالی، تودرتو، اجباری و اختیاری و غیره) است. در FictionBook نمودار در فایل FictionBook2.xsd است. نمونه ای از طرحواره XML را می توان در اینجا یافت پیوند (توسط فروشگاه کتاب الکترونیکی لیتری استفاده می شود).

ساختار سند FB2

متن در سند نگه داشته شد در برچسب های ویژه - عناصر انواع پاراگراف: ، و . یک عنصر نیز وجود دارد ، که محتوایی ندارد و برای درج شکاف استفاده می شود.

همه اسناد با یک تگ ریشه شروع می شوند ، که در زیر آن ممکن است ظاهر شود ، ، و .

برچسب بزنید حاوی شیوه نامه برای تسهیل تبدیل به فرمت های دیگر. که در دروغ با استفاده از کدگذاری base64 داده هایی که ممکن است برای ارائه سند مورد نیاز باشد.

عنصر شامل تمام اطلاعات لازم در مورد کتاب است: ژانر اثر، فهرست نویسندگان (نام کامل، آدرس ایمیل و وب سایت)، عنوان، بلوک با کلمات کلیدی، حاشیه نویسی. همچنین ممکن است حاوی اطلاعاتی در مورد تغییرات ایجاد شده در سند و اطلاعاتی در مورد ناشر کتاب در صورت چاپ روی کاغذ باشد.

این همان چیزی است که بخشی از بلوک به نظر می رسد در ورودی کتاب داستانی برای کار می کند «مطالعه ای در اسکارلت» نوشته آرتور کانن دویل، برگرفته از پروژه گوتنبرگ:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

جزء کلیدی یک سند کتاب داستانی است . حاوی متن خود کتاب است. می تواند چندین مورد از این برچسب ها در سراسر سند وجود داشته باشد - بلوک های اضافی برای ذخیره پاورقی ها، نظرات و یادداشت ها استفاده می شود.

FictionBook همچنین چندین تگ برای کار با لینک ها ارائه می دهد. آنها بر اساس مشخصات هستند XLink، توسط کنسرسیوم توسعه یافته است W3C به طور خاص برای ایجاد پیوند بین منابع مختلف در اسناد XML.

مزایای فرمت

استاندارد FB2 فقط شامل حداقل مجموعه تگ های مورد نیاز (برای داستان "طراحی" کافی است) که پردازش آن را توسط خوانندگان ساده می کند. علاوه بر این، در صورت عملکرد مستقیم خواننده با فرمت FB، کاربر این فرصت را دارد که تقریباً تمام پارامترهای نمایش را سفارشی کند.

ساختار دقیق سند به شما امکان می دهد فرآیند تبدیل از فرمت FB به فرمت دیگر را خودکار کنید. همین ساختار کار با عناصر جداگانه اسناد را امکان پذیر می کند - تنظیم فیلترها توسط نویسندگان کتاب، عنوان، ژانر و غیره. به همین دلیل، فرمت FB2 در Runet محبوبیت پیدا کرده است و به استاندارد پیش فرض در کتابخانه ها و کتابخانه های الکترونیکی روسیه تبدیل شده است. در کشورهای CIS

معایب فرمت

سادگی فرمت FB2 مزیت و معایب آن است. این کارکرد طرح بندی متن پیچیده را محدود می کند (به عنوان مثال، یادداشت ها در حاشیه). گرافیک برداری یا پشتیبانی از لیست های شماره گذاری شده ندارد. به همین دلیل فرمت خیلی مناسب نیست برای کتاب های درسی، کتاب های مرجع و ادبیات فنی (نام قالب حتی در مورد این صحبت می کند - کتاب داستانی یا "کتاب داستانی").

در عین حال، برای نمایش حداقل اطلاعات در مورد کتاب - عنوان، نویسنده و جلد - برنامه باید تقریباً کل سند XML را پردازش کند. این به این دلیل است که ابرداده در ابتدای متن و تصاویر در انتهای متن آمده است.

FB3 - توسعه قالب

به دلیل افزایش الزامات برای قالب بندی متون کتاب (و به منظور کاهش برخی از کاستی های FB2)، گریبوف کار بر روی قالب FB3 را آغاز کرد. توسعه بعدا متوقف شد، اما در سال 2014 متوقف شد از سر گرفته شد.

به گفته نویسندگان، آنها نیازهای واقعی را هنگام انتشار ادبیات فنی مطالعه کردند، به کتاب های درسی، کتاب های مرجع، راهنماها نگاه کردند و مجموعه مشخص تری از برچسب ها را ترسیم کردند که به هر کتابی اجازه نمایش می دهد.

در مشخصات جدید، فرمت FictionBook یک آرشیو فشرده است که در آن فراداده، تصاویر و متن به عنوان فایل های جداگانه ذخیره می شود. الزامات فرمت فایل فشرده و قراردادهای سازمان آن در استاندارد مشخص شده است ECMA-376که Open XML را تعریف می کند.

تعدادی از پیشرفت‌ها در رابطه با قالب‌بندی (فاصله‌گذاری، خط‌کشی) انجام شد و یک شی جدید اضافه شد - یک "بلوک" - که یک قطعه دلخواه از یک کتاب را به شکل یک چهارگوش قالب‌بندی می‌کند و می‌تواند در متن با بسته بندی جاسازی شود. اکنون از لیست های شماره گذاری شده و گلوله ای پشتیبانی می شود.

FB3 تحت یک مجوز رایگان توزیع می شود و منبع باز است، بنابراین همه ابزارهای کاربردی در دسترس ناشران و کاربران هستند: مبدل ها، ویرایشگرهای ابری، خوانندگان. جاری نسخه قالب، خواننده и سردبیر را می توان در مخزن GitHub پروژه یافت.

به طور کلی، FictionBook3 هنوز هم نسبت به برادر بزرگتر خود گسترش کمتری دارد، اما چندین کتابخانه الکترونیکی در حال حاضر کتاب هایی را در این قالب ارائه می دهند. و لیترها چند سال پیش اعلام کردند که قصد دارند کل کاتالوگ خود را به یک قالب جدید منتقل کنند. برخی از خوانندگان در حال حاضر از تمام عملکردهای لازم FB3 پشتیبانی می کنند. به عنوان مثال، تمام مدل های مدرن خواننده های ONYX می توانند با این فرمت خارج از جعبه کار کنند، به عنوان مثال، داروین 3 یا کلئوپاترا 3.

کتاب های الکترونیکی و فرمت های آنها: FB2 و FB3 - تاریخچه، مزایا، معایب و اصول کار
/ ONYX BOOX کلئوپاترا 3

توزیع گسترده‌تر FictionBook3 یک اکوسیستم ایجاد می‌کند جهت دار برای کار کردن به طور کامل و مؤثر با متن در هر دستگاهی با منابع محدود: صفحه نمایش سیاه و سفید یا کوچک، حافظه کم و غیره. به گفته توسعه دهندگان، یک کتاب پس از تنظیم در هر محیطی تا حد امکان راحت خواهد بود.

PS ما چندین بررسی از خوانندگان ONYX BOOX را مورد توجه شما قرار می دهیم:



منبع: www.habr.com

اضافه کردن نظر