Цахим ном ба тэдгээрийн формат: FB2 ба FB3 - түүх, давуу, сул тал, үйл ажиллагааны зарчим

Өмнөх нийтлэлд бид энэ тухай ярьсан DjVu форматын онцлог. Өнөөдөр бид FB2 гэгддэг FictionBook2 формат болон түүний залгамжлагч FB3 дээр анхаарлаа хандуулахаар шийдсэн.

Цахим ном ба тэдгээрийн формат: FB2 ба FB3 - түүх, давуу, сул тал, үйл ажиллагааны зарчим
/flickr/ Жудит Клейн / CC

Форматын харагдах байдал

90-ээд оны дундуур сонирхогчид эхлэв Зөвлөлтийн номыг цахимжуулах. Тэд уран зохиолыг олон янзын хэлбэрээр орчуулж, хадгалдаг байв. Рунет дахь анхны номын сангуудын нэг - Максим Мошковын номын сан - форматлагдсан текст файл (TXT) ашигласан.

Байтын эвдрэлд тэсвэртэй, олон талт байдлаас шалтгаалан сонголт нь түүний талд хийгдсэн - TXT нь ямар ч үйлдлийн систем дээр нээгддэг. Гэсэн хэдий ч тэр хэцүү болгосон хадгалагдсан текст мэдээллийг боловсруулах. Жишээлбэл, мянга дахь мөрөнд шилжихийн тулд өмнөх 999 мөрийг боловсруулах шаардлагатай байв. Мөн номууд хадгалсан Word баримт бичиг болон PDF дээр - сүүлийнх нь бусад формат руу хөрвүүлэхэд хэцүү байсан бөгөөд сул компьютерууд нээгдэж, харуулсан Сааталтай PDF баримтууд.

HTML-г цахим ном зохиолыг "хадгалахад" бас ашигладаг байсан. Энэ нь индексжүүлэх, бусад формат руу хөрвүүлэх, баримт бичиг үүсгэх (текстийг шошголох) үйл явцыг хялбаршуулсан боловч өөрийн гэсэн дутагдалтай талуудыг танилцуулсан. Хамгийн чухал нь "тодорхой бус байдал» стандарт: шошго бичихдээ тодорхой эрх чөлөөг олгосон. Тэдний зарим нь хаагдах ёстой байсан бол зарим нь (жишээлбэл, ) - үүнийг хаах шаардлагагүй байсан. Шошгууд нь дур мэдэн үүрлэх дараалалтай байж болно.

Хэдийгээр файлуудтай ажиллахыг дэмжээгүй - ийм баримт бичгийг буруу гэж үзсэн - стандарт нь уншигчдад агуулгыг харуулахыг оролдохыг шаарддаг. Хэрэглээ болгонд "таамаглах" үйл явц өөр өөрийн замаар хэрэгждэг байсан тул энд л бэрхшээл гарч ирэв. Үүний зэрэгцээ, тухайн үед зах зээл дээр байгаа унших төхөөрөмж, програмууд ойлгосон нэг эсвэл хоёр тусгай формат. Хэрэв ном нэг форматтай байсан бол уншихын тулд дахин форматлах шаардлагатай байв. Энэ бүх дутагдлыг арилгах зорилготой байсан Уран зохиолын ном2, эсвэл FB2, текст болон хөрвүүлэлтийн анхны "самнах" ажлыг авсан.

Энэ формат нь анхны хувилбартай байсныг анхаарна уу - Уран зохиолын ном1 - гэхдээ энэ нь зөвхөн туршилтын шинж чанартай байсан, удаан үргэлжилсэнгүй, одоогоор дэмжигдээгүй, хоцрогдсон нийцтэй биш юм. Тиймээс FictionBook нь ихэвчлэн түүний "залгамжлагч" - FB2 форматыг хэлдэг.

FB2-г тэргүүтэй хэсэг хөгжүүлэгчид бүтээсэн Дмитрий Грибовлитрийн компанийн техникийн захирал, "Haali Reader" сэтгүүлийг бүтээгч Михаил Мацнев нар. Энэ формат нь HTML-ээс илүү хаалттай, үүрлэсэн шошготой ажиллахыг зохицуулдаг XML дээр суурилдаг. XML баримт бичигт XML схем гэж нэрлэгддэг зүйл дагалддаг. XML схем нь бүх тэмдэглэгээг агуулсан тусгай файл бөгөөд тэдгээрийг ашиглах дүрмийг (дараалал, үүрлэх, заавал хийх ба нэмэлт гэх мэт) тайлбарладаг. FictionBook дээр диаграмм нь FictionBook2.xsd файлд байна. Жишээ XML схемийг эндээс олж болно холбоос (энэ нь литрийн цахим номын дэлгүүрт ашиглагддаг).

FB2 баримт бичгийн бүтэц

Баримт бичигт байгаа текст хадгалагдсан тусгай шошгонд - догол мөрийн төрлийн элементүүд: , Тэгээд . Элемент бас бий , ямар ч агуулгагүй бөгөөд хоосон зай оруулахад ашигладаг.

Бүх баримт бичиг нь root хаягаар эхэлдэг , доор гарч ирж болно , , Тэгээд .

Tag Бусад формат руу хөрвүүлэхэд туслах загварын хүснэгтүүдийг агуулсан. IN ашиглан кодлогдсон худлаа base64 баримт бичгийг гаргахад шаардлагатай өгөгдөл.

Бүрэлдэхүүн номын талаар шаардлагатай бүх мэдээллийг агуулсан: бүтээлийн төрөл, зохиогчдын жагсаалт (бүтэн нэр, цахим шуудангийн хаяг, вэбсайт), гарчиг, түлхүүр үг бүхий блок, тайлбар. Мөн баримт бичигт оруулсан өөрчлөлтийн талаарх мэдээлэл, цаасан дээр хэвлэгдсэн бол ном хэвлэгчийн талаарх мэдээллийг агуулж болно.

Блокны хэсэг нь иймэрхүү харагдаж байна -д зориулсан FictionBook оруулгад ажилладаг Артур Конан Дойлын "A Study in Scarlet" номоос авсан Гутенберг төсөл:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

FictionBook баримт бичгийн гол бүрэлдэхүүн хэсэг нь . Энэ нь өөрөө номын текстийг агуулдаг. Баримт бичгийн туршид эдгээр шошго хэд хэдэн байж болно - нэмэлт блокуудыг зүүлт тайлбар, тайлбар, тэмдэглэл хадгалахад ашигладаг.

FictionBook нь гипер холбоостой ажиллах хэд хэдэн шошготой байдаг. Тэдгээр нь техникийн үзүүлэлтүүд дээр суурилдаг Xlink, консорциумын боловсруулсан W3C XML баримт бичигт өөр өөр эх сурвалжуудын хооронд холбоос үүсгэхэд зориулагдсан.

Форматын давуу тал

FB2 стандарт нь зөвхөн шаардлагатай хамгийн бага багц шошгыг агуулдаг (зохион бүтээхэд хангалттай) бөгөөд энэ нь уншигчдын боловсруулалтыг хялбаршуулдаг. Түүнчлэн, уншигчийг FB форматаар шууд ажиллуулах тохиолдолд хэрэглэгч бараг бүх дэлгэцийн параметрүүдийг өөрчлөх боломжтой болно.

Баримт бичгийн хатуу бүтэц нь FB форматаас өөр формат руу хөрвүүлэх үйл явцыг автоматжуулах боломжийг олгодог. Үүнтэй ижил бүтэц нь баримт бичгийн бие даасан элементүүдтэй ажиллах боломжийг олгодог - номын зохиогч, гарчиг, төрөл гэх мэт шүүлтүүрийг тохируулах. Энэ шалтгааны улмаас FB2 формат нь Runet-д түгээмэл болж, Оросын цахим номын сан, номын санд анхдагч стандарт болсон. ТУХН-ийн орнуудад.

Форматын сул тал

FB2 форматын энгийн байдал нь түүний давуу болон сул тал юм. Энэ нь нарийн төвөгтэй текстийн байршлын функцийг хязгаарладаг (жишээлбэл, захын тэмдэглэл). Энэ нь вектор график эсвэл дугаарлагдсан жагсаалтыг дэмждэггүй. Энэ шалтгааны улмаас формат тийм ч тохиромжтой биш сурах бичиг, лавлах ном, техникийн уран зохиолын хувьд (хэлбэрийн нэр нь энэ тухай өгүүлдэг - уран зохиол эсвэл "уран зохиолын ном").

Үүний зэрэгцээ, номын тухай хамгийн бага мэдээллийг харуулахын тулд - гарчиг, зохиогч, хавтас - програм нь бараг бүх XML баримтыг боловсруулах шаардлагатай. Учир нь текстийн эхэнд мета өгөгдөл, төгсгөлд нь зураг ирдэг.

FB3 - формат боловсруулах

Номын текстийг форматлахад тавигдах шаардлага нэмэгдсэн (мөн FB2-ийн зарим дутагдлыг багасгахын тулд) Грибов FB3 формат дээр ажиллаж эхэлсэн. Хөгжил сүүлдээ зогссон ч 2014 онд болсон үргэлжлүүлэв.

Зохиогчдын үзэж байгаагаар тэд техникийн ном хэвлэл гаргахдаа бодит хэрэгцээг судалж, сурах бичиг, лавлах ном, гарын авлагыг үзэж, ямар ч номыг харуулах боломжийг олгодог илүү тодорхой шошгоуудыг тодорхойлсон.

Шинэ тодорхойлолтод FictionBook формат нь мета өгөгдөл, зураг, текстийг тусдаа файл болгон хадгалдаг зип архив юм. Зип файлын формат, түүнийг зохион байгуулах конвенцид тавигдах шаардлагыг стандартад заасан болно ECMA-376, энэ нь Open XML-г тодорхойлдог.

Форматлах (зай, доогуур зураас) -тай холбоотой хэд хэдэн сайжруулалт хийгдсэн бөгөөд номын дурын фрагментийг дөрвөлжин хэлбэрээр форматлаж, текстэнд ороож оруулах боломжтой "блок" гэсэн шинэ объект нэмэгдсэн. Одоо дугаарласан болон тэмдэглэгдсэн жагсаалтыг дэмжих боломжтой болсон.

FB3 нь үнэгүй лицензийн дагуу түгээгддэг бөгөөд нээлттэй эх сурвалж тул бүх хэрэгслийг хэвлэн нийтлэгчид болон хэрэглэгчид ашиглах боломжтой: хөрвүүлэгч, үүл засварлагч, уншигч. Одоогийн хувилбар нь формат, уншигч и редактор төслийн GitHub репозитороос олж болно.

Ерөнхийдөө FictionBook3 нь ахаасаа бага тархсан хэвээр байгаа ч хэд хэдэн цахим номын сангууд энэ форматтай номыг санал болгож байна. Хэдэн жилийн өмнө литрүүд каталогоо бүхэлд нь шинэ формат руу шилжүүлэх хүсэлтэй байгаагаа зарлав. Зарим уншигчид шаардлагатай бүх FB3 функцийг аль хэдийн дэмждэг. Жишээлбэл, ONYX уншигчийн орчин үеийн бүх загварууд энэ форматтай ажиллах боломжтой, жишээлбэл, Дарвин 3 буюу Клеопатра 3.

Цахим ном ба тэдгээрийн формат: FB2 ба FB3 - түүх, давуу, сул тал, үйл ажиллагааны зарчим
/ ONYX BOOX Клеопатра 3

FictionBook3-ийг илүү өргөнөөр түгээх нь экосистемийг бий болгоно чиглэсэн Хязгаарлагдмал нөөцтэй ямар ч төхөөрөмж дээр тексттэй бүрэн бөгөөд үр дүнтэй ажиллах: хар цагаан эсвэл жижиг дэлгэц, бага санах ой гэх мэт. Хөгжүүлэгчдийн үзэж байгаагаар номыг нэг удаа хэвлэсэн нь ямар ч орчинд аль болох тохиромжтой байх болно.

Жич ONYX BOOX уншигчдын хэд хэдэн тоймыг бид танд хүргэж байна.



Эх сурвалж: www.habr.com

сэтгэгдэл нэмэх