E-Book และรูปแบบ: FB2 และ FB3 - ประวัติ ข้อดี ข้อเสีย และหลักการทำงาน

ในบทความก่อนหน้านี้เราพูดถึง คุณสมบัติของรูปแบบ DjVu. วันนี้เราตัดสินใจที่จะมุ่งเน้นไปที่รูปแบบ FictionBook2 หรือที่รู้จักกันดีในชื่อ FB2 และ "ผู้สืบทอด" FB3

E-Book และรูปแบบ: FB2 และ FB3 - ประวัติ ข้อดี ข้อเสีย และหลักการทำงาน
/flickr/ จูดิท ไคลน์ / CC

การปรากฏตัวของรูปแบบ

ในช่วงกลางทศวรรษที่ 90 ผู้ที่ชื่นชอบ เราเริ่มต้น แปลงหนังสือโซเวียตให้เป็นดิจิทัล พวกเขาแปลและอนุรักษ์วรรณกรรมในรูปแบบต่างๆ มากมาย หนึ่งในห้องสมุดแห่งแรกใน Runet - ห้องสมุดของ Maxim Moshkov - ใช้ไฟล์ข้อความที่จัดรูปแบบ (TXT)

ตัวเลือกนี้ได้รับความโปรดปรานเนื่องจากการต้านทานความเสียหายของไบต์และความคล่องตัว - TXT เปิดบนระบบปฏิบัติการใดก็ได้ อย่างไรก็ตามเขา ทำให้มันยาก การประมวลผลข้อมูลข้อความที่เก็บไว้ ตัวอย่างเช่น หากต้องการย้ายไปยังบรรทัดที่พัน จะต้องประมวลผล 999 บรรทัดที่อยู่ก่อนหน้านั้น หนังสืออีกด้วย เก็บไว้ ในเอกสาร Word และ PDF - อย่างหลังนั้นยากที่จะแปลงเป็นรูปแบบอื่นและคอมพิวเตอร์ที่อ่อนแอก็เปิดขึ้นและ แสดง เอกสาร PDF ที่มีความล่าช้า

HTML ยังใช้เพื่อ "จัดเก็บ" วรรณกรรมอิเล็กทรอนิกส์ ทำให้การจัดทำดัชนี การแปลงเป็นรูปแบบอื่น และการสร้างเอกสาร (การแท็กข้อความ) ง่ายขึ้น แต่ก็มีข้อบกพร่องในตัวมันเอง สิ่งที่สำคัญที่สุดประการหนึ่งคือ “ความคลุมเครือ» มาตรฐาน: อนุญาตให้มีเสรีภาพบางอย่างเมื่อเขียนแท็ก บางแห่งต้องปิด บางแห่ง (เช่น ) - ไม่จำเป็นต้องปิด แท็กอาจมีลำดับการซ้อนตามต้องการ

และแม้ว่าจะไม่สนับสนุนการทำงานกับไฟล์ดังกล่าว แต่เอกสารดังกล่าวถือว่าไม่ถูกต้อง - ผู้อ่านจำเป็นต้องพยายามแสดงเนื้อหาตามมาตรฐาน นี่คือจุดที่เกิดปัญหาเนื่องจากในแต่ละแอปพลิเคชันกระบวนการ "เดา" ได้ถูกนำไปใช้ในแบบของตัวเอง ในขณะเดียวกันอุปกรณ์การอ่านและแอพพลิเคชั่นที่มีอยู่ในตลาดในขณะนั้น เข้าใจแล้ว หนึ่งหรือสองรูปแบบพิเศษ หากมีหนังสือในรูปแบบเดียว จะต้องจัดรูปแบบใหม่จึงจะอ่านได้ มีจุดมุ่งหมายเพื่อแก้ไขข้อบกพร่องเหล่านี้ทั้งหมด หนังสือนิยาย2หรือ FB2 ซึ่งเข้ามาแทนที่ "การรวม" เบื้องต้นของข้อความและการแปลง

โปรดทราบว่ารูปแบบนี้มีเวอร์ชันแรก - หนังสือนิยาย1 - อย่างไรก็ตาม มันเป็นเพียงการทดลองโดยธรรมชาติ ใช้งานได้ไม่นาน ปัจจุบันยังไม่รองรับ และเข้ากันไม่ได้แบบย้อนหลัง ดังนั้น FictionBook จึงมักหมายถึง "ผู้สืบทอด" - รูปแบบ FB2

FB2 ถูกสร้างขึ้นโดยกลุ่มนักพัฒนาที่นำโดย มิทรี กรีบอฟซึ่งเป็นผู้อำนวยการด้านเทคนิคของบริษัท ลิตร และมิคาอิล มัตสเนฟ ผู้สร้าง Haali Reader รูปแบบจะขึ้นอยู่กับ XML ซึ่งควบคุมการทำงานกับแท็กที่ไม่ปิดและซ้อนกันอย่างเข้มงวดมากกว่า HTML เอกสาร XML จะมาพร้อมกับสิ่งที่เรียกว่า XML Schema สคีมา XML เป็นไฟล์พิเศษที่มีแท็กทั้งหมดและอธิบายกฎสำหรับการใช้งาน (ลำดับ การซ้อน บังคับและเป็นทางเลือก ฯลฯ) ใน FictionBook แผนภาพอยู่ในไฟล์ FictionBook2.xsd สามารถดูตัวอย่างสคีมา XML ได้ที่ ลิงค์ (มันถูกใช้โดยร้าน e-book ลิตร)

โครงสร้างเอกสาร FB2

ข้อความในเอกสาร จะถูกเก็บไว้ ในแท็กพิเศษ - องค์ประกอบของประเภทย่อหน้า: , และ . ก็ยังมีธาตุ ซึ่งไม่มีเนื้อหาและใช้เพื่อแทรกช่องว่าง

เอกสารทั้งหมดเริ่มต้นด้วยแท็กรูท ด้านล่างซึ่งอาจปรากฏขึ้น , , และ .

แท็ก มีสไตล์ชีตเพื่ออำนวยความสะดวกในการแปลงเป็นรูปแบบอื่น ใน โกหกเข้ารหัสโดยใช้ base64 ข้อมูลที่อาจจำเป็นในการแสดงเอกสาร

องค์ประกอบ มีข้อมูลที่จำเป็นทั้งหมดเกี่ยวกับหนังสือ: ประเภทของงาน รายชื่อผู้แต่ง (ชื่อเต็ม ที่อยู่อีเมล และเว็บไซต์) ชื่อเรื่อง บล็อกที่มีคำหลัก คำอธิบายประกอบ นอกจากนี้ยังอาจมีข้อมูลเกี่ยวกับการเปลี่ยนแปลงที่ทำกับเอกสารและข้อมูลเกี่ยวกับผู้จัดพิมพ์หนังสือหากมีการตีพิมพ์บนกระดาษ

นี่คือลักษณะของส่วนหนึ่งของบล็อก ในรายการ FictionBook สำหรับ โรงงาน “A Study in Scarlet” โดย อาเธอร์ โคนัน ดอยล์ นำมาจาก โครงการกูเทนเบิร์ก:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

องค์ประกอบสำคัญของเอกสาร FictionBook คือ . มันมีข้อความของหนังสือเอง แท็กเหล่านี้อาจมีได้หลายแท็กในเอกสาร - บล็อกเพิ่มเติมจะใช้เพื่อจัดเก็บเชิงอรรถ ความคิดเห็น และบันทึกย่อ

FictionBook ยังมีแท็กหลายแท็กสำหรับการทำงานกับไฮเปอร์ลิงก์ ขึ้นอยู่กับข้อกำหนด เอ็กซ์ลิงค์พัฒนาโดยสมาคม W3C โดยเฉพาะสำหรับการสร้างลิงค์ระหว่างทรัพยากรต่าง ๆ ในเอกสาร XML

ข้อดีของรูปแบบ

มาตรฐาน FB2 ประกอบด้วยชุดแท็กขั้นต่ำที่จำเป็นเท่านั้น (เพียงพอสำหรับ "การออกแบบ" เรื่องแต่ง) ซึ่งช่วยให้ผู้อ่านประมวลผลได้ง่ายขึ้น นอกจากนี้ ในกรณีของการดำเนินการโดยตรงของเครื่องอ่านด้วยรูปแบบ FB ผู้ใช้จะมีโอกาสปรับแต่งพารามิเตอร์การแสดงผลเกือบทั้งหมดได้

โครงสร้างที่เข้มงวดของเอกสารทำให้กระบวนการแปลงจากรูปแบบ FB ไปเป็นรูปแบบอื่นเป็นแบบอัตโนมัติ โครงสร้างเดียวกันทำให้สามารถทำงานกับองค์ประกอบแต่ละส่วนของเอกสารได้ - ตั้งค่าตัวกรองตามผู้แต่งหนังสือ ชื่อ ประเภท ฯลฯ ด้วยเหตุนี้ รูปแบบ FB2 จึงได้รับความนิยมใน Runet และกลายเป็นมาตรฐานเริ่มต้นในห้องสมุดอิเล็กทรอนิกส์และห้องสมุดอิเล็กทรอนิกส์ของรัสเซีย ในประเทศ CIS

ข้อเสียของรูปแบบ

ความเรียบง่ายของรูปแบบ FB2 คือข้อดีและข้อเสียในเวลาเดียวกัน ซึ่งจะจำกัดฟังก์ชันสำหรับเค้าโครงข้อความที่ซับซ้อน (เช่น บันทึกย่อที่ระยะขอบ) ไม่มีกราฟิกแบบเวกเตอร์หรือรองรับรายการลำดับเลข ด้วยเหตุนี้รูปแบบ ไม่เหมาะมาก สำหรับตำราเรียน หนังสืออ้างอิง และวรรณกรรมทางเทคนิค (ชื่อของรูปแบบยังพูดถึงเรื่องนี้ - หนังสือนิยายหรือ "หนังสือนิยาย")

ในเวลาเดียวกัน เพื่อที่จะแสดงข้อมูลขั้นต่ำเกี่ยวกับหนังสือ - ชื่อหนังสือ ผู้แต่ง และปก - โปรแกรมจำเป็นต้องประมวลผลเอกสาร XML เกือบทั้งหมด เนื่องจากข้อมูลเมตามาที่จุดเริ่มต้นของข้อความและรูปภาพอยู่ท้ายข้อความ

FB3 - การพัฒนารูปแบบ

เนื่องจากข้อกำหนดที่เพิ่มขึ้นสำหรับการจัดรูปแบบข้อความในหนังสือ (และเพื่อลดข้อบกพร่องบางประการของ FB2) Gribov จึงเริ่มทำงานในรูปแบบ FB3 การพัฒนาหยุดในเวลาต่อมา แต่ในปี 2014 ก็เป็นเช่นนั้น ดำเนินการต่อ.

ตามที่ผู้เขียนระบุ พวกเขาศึกษาความต้องการที่แท้จริงเมื่อเผยแพร่วรรณกรรมทางเทคนิค ดูที่ตำราเรียน หนังสืออ้างอิง คู่มือ และสรุปชุดแท็กที่เฉพาะเจาะจงมากขึ้นซึ่งจะช่วยให้สามารถแสดงหนังสือเล่มใดก็ได้

ในข้อกำหนดใหม่ รูปแบบ FictionBook จะเป็นไฟล์ ZIP ซึ่งข้อมูลเมตา รูปภาพ และข้อความจะถูกจัดเก็บเป็นไฟล์แยกกัน ข้อกำหนดสำหรับรูปแบบไฟล์ zip และแบบแผนสำหรับองค์กรระบุไว้ในมาตรฐาน ECMA-376ซึ่งกำหนด Open XML

มีการปรับปรุงหลายประการที่เกี่ยวข้องกับการจัดรูปแบบ (การเว้นวรรค การขีดเส้นใต้) และมีการเพิ่มออบเจ็กต์ใหม่ - "บล็อก" ซึ่งจัดรูปแบบส่วนย่อยของหนังสือตามอำเภอใจในรูปแบบของรูปสี่เหลี่ยมและสามารถฝังลงในข้อความโดยมีการล้อมรอบ ขณะนี้มีการรองรับรายการลำดับเลขและสัญลักษณ์แสดงหัวข้อย่อยแล้ว

FB3 ได้รับการเผยแพร่ภายใต้ใบอนุญาตฟรีและเป็นโอเพ่นซอร์ส ดังนั้นผู้เผยแพร่และผู้ใช้จึงสามารถเข้าถึงยูทิลิตี้ทั้งหมดได้: ตัวแปลง, โปรแกรมแก้ไขคลาวด์, โปรแกรมอ่าน ปัจจุบัน รุ่น รูปแบบ, ผู้อ่าน и บรรณาธิการ สามารถพบได้ในพื้นที่เก็บข้อมูล GitHub ของโครงการ

โดยทั่วไป FictionBook3 ยังคงแพร่หลายน้อยกว่าพี่ชาย แต่ห้องสมุดอิเล็กทรอนิกส์หลายแห่งมีหนังสือในรูปแบบนี้อยู่แล้ว และเมื่อสองสามปีที่แล้วลิตรได้ประกาศความตั้งใจที่จะโอนแคตตาล็อกทั้งหมดไปเป็นรูปแบบใหม่ โปรแกรมอ่านบางส่วนรองรับฟังก์ชัน FB3 ที่จำเป็นทั้งหมดแล้ว ตัวอย่างเช่น เครื่องอ่าน ONYX รุ่นใหม่ทุกรุ่นสามารถทำงานกับรูปแบบนี้ได้ทันทีเช่น ดาร์วิน 3 หรือ คลีโอพัตรา3.

E-Book และรูปแบบ: FB2 และ FB3 - ประวัติ ข้อดี ข้อเสีย และหลักการทำงาน
/ โอนิกซ์ บูกซ์ คลีโอพัตรา 3

การกระจายของ FictionBook3 ในวงกว้างมากขึ้นจะสร้างระบบนิเวศ มุ่งเน้น เพื่อทำงานกับข้อความบนอุปกรณ์ใดๆ ที่มีทรัพยากรจำกัดได้อย่างเต็มที่และมีประสิทธิภาพ เช่น จอแสดงผลขาวดำหรือขนาดเล็ก หน่วยความจำเหลือน้อย ฯลฯ ตามที่นักพัฒนาระบุว่า หนังสือที่จัดวางครั้งเดียวจะสะดวกที่สุดเท่าที่จะเป็นไปได้ในทุกสภาพแวดล้อม

ป.ล. เราขอนำเสนอบทวิจารณ์หลายรายการเกี่ยวกับผู้อ่าน ONYX BOOX:



ที่มา: will.com

เพิ่มความคิดเห็น