Librat elektronikë dhe formatet e tyre: FB2 dhe FB3 - historia, të mirat, të këqijat dhe parimet e punës

Në artikullin e mëparshëm kemi folur për veçoritë e formatit DjVu. Sot vendosëm të fokusohemi në formatin FictionBook2, i njohur më mirë si FB2, dhe "pasardhësin" e tij FB3.

Librat elektronikë dhe formatet e tyre: FB2 dhe FB3 - historia, të mirat, të këqijat dhe parimet e punës
/flickr/ Judit Klein / CC

Shfaqja e formatit

Në mesin e viteve '90, entuziastë filloi dixhitalizoni librat sovjetikë. Ata përkthyen dhe ruajtën literaturë në një larmi formatesh. Një nga bibliotekat e para në Runet - Biblioteka e Maxim Moshkov - përdori një skedar teksti të formatuar (TXT).

Zgjedhja u bë në favor të saj për shkak të rezistencës ndaj korrupsionit dhe shkathtësisë së bajtit - TXT hapet në çdo sistem operativ. Megjithatë, ai e bëri të vështirë përpunimi i informacionit të tekstit të ruajtur. Për shembull, për të kaluar në rreshtin e mijëtë, duhej të përpunoheshin 999 rreshta që i paraprinin. Libra gjithashtu të ruajtura në dokumentet Word dhe PDF - kjo e fundit ishte e vështirë të konvertohej në formate të tjera, dhe kompjuterët e dobët u hapën dhe shfaqur Dokumentet PDF me vonesa.

HTML u përdor gjithashtu për të "ruajtur" literaturën elektronike. E bëri më të lehtë indeksimin, konvertimin në formate të tjera dhe krijimin e dokumenteve (etiketimit të tekstit), por paraqiti mangësitë e veta. Një nga më të rëndësishmet ishte "paqartësi» standard: lejonte disa liri kur shkruani etiketa. Disa prej tyre duhej të mbylleshin, të tjerët (për shembull, ) - nuk kishte nevojë ta mbyllte. Vetë etiketat mund të kenë një renditje arbitrare të foleve.

Dhe megjithëse një punë e tillë me skedarë nuk inkurajohej - dokumente të tilla konsideroheshin të pasakta - standardi kërkonte që lexuesit të përpiqeshin të shfaqnin përmbajtjen. Këtu lindën vështirësitë, pasi në çdo aplikim procesi i "supozimit" zbatohej në mënyrën e vet. Në të njëjtën kohë, pajisjet dhe aplikacionet e leximit të disponueshme në treg në atë kohë kuptuar një ose dy formate të specializuara. Nëse një libër ishte i disponueshëm në një format, ai duhej të riformatohej në mënyrë që të lexohej. Ishte synuar të zgjidheshin të gjitha këto mangësi Libri Fiksi2, ose FB2, e cila mori përsipër "krehjen" fillestare të tekstit dhe konvertimin.

Vini re se formati kishte versionin e tij të parë - Libri Fiksi1 - megjithatë, ai ishte vetëm në natyrë eksperimentale, nuk zgjati shumë, aktualisht nuk mbështetet dhe nuk është i pajtueshëm me prapavijë. Prandaj, FictionBook më shpesh nënkupton "pasardhësin" e tij - formatin FB2.

FB2 u krijua nga një grup zhvilluesish të udhëhequr nga Dmitry Gribov, i cili është drejtor teknik i kompanisë së litrave dhe Mikhail Matsnev, krijuesi i Haali Reader. Formati bazohet në XML, i cili rregullon punën me etiketat e pambyllura dhe të mbivendosura në mënyrë më strikte sesa HTML. Një dokument XML shoqërohet nga një skemë e ashtuquajtur XML. Një skemë XML është një skedar i veçantë që përmban të gjitha etiketat dhe përshkruan rregullat për përdorimin e tyre (sekuenca, foleja, e detyrueshme dhe opsionale, etj.). Në FictionBook, diagrami është në skedarin FictionBook2.xsd. Një shembull i skemës XML mund të gjendet në lidhje (përdoret nga dyqani i librave elektronikë me litra).

Struktura e dokumentit FB2

Teksti në dokument është ruajtur në etiketa speciale - elemente të llojeve të paragrafëve: , Dhe . Ekziston edhe një element , i cili nuk ka përmbajtje dhe përdoret për të futur boshllëqe.

Të gjitha dokumentet fillojnë me një etiketë rrënjë , më poshtë mund të shfaqet , , Dhe .

Etiketë përmban fletë stilesh për të lehtësuar konvertimin në formate të tjera. NË gënjeshtër e koduar duke përdorur base64 të dhënat që mund të nevojiten për të dhënë dokumentin.

Elementi përmban të gjithë informacionin e nevojshëm për librin: zhanrin e veprës, listën e autorëve (emri i plotë, adresa e emailit dhe faqja e internetit), titulli, blloku me fjalë kyçe, shënimi. Mund të përmbajë gjithashtu informacione për ndryshimet e bëra në dokument dhe informacione për botuesin e librit nëse ai është botuar në letër.

Kështu duket pjesa e bllokut në hyrjen FictionBook për punon "A Study in Scarlet" nga Arthur Conan Doyle, marrë nga Projekti Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Komponenti kryesor i një dokumenti FictionBook është . Ai përmban vetë tekstin e librit. Mund të ketë disa nga këto etiketa në të gjithë dokumentin - blloqe shtesë përdoren për të ruajtur fusnotat, komentet dhe shënimet.

FictionBook ofron gjithashtu disa etiketa për të punuar me hiperlidhje. Ato bazohen në specifikimet XLink, zhvilluar nga konsorciumi W3C posaçërisht për krijimin e lidhjeve ndërmjet burimeve të ndryshme në dokumentet XML.

Përparësitë e formatit

Standardi FB2 përfshin vetëm grupin minimal të kërkuar të etiketave (të mjaftueshme për të "dizajnuar" trillime), gjë që thjeshton përpunimin e tij nga lexuesit. Për më tepër, në rastin e funksionimit të drejtpërdrejtë të lexuesit me formatin FB, përdoruesi ka mundësinë të personalizojë pothuajse të gjithë parametrat e ekranit.

Struktura strikte e dokumentit ju lejon të automatizoni procesin e konvertimit nga formati FB në ndonjë tjetër. E njëjta strukturë bën të mundur punën me elementë individualë të dokumenteve - vendosja e filtrave nga autorët e librave, titulli, zhanri, etj. Për këtë arsye, formati FB2 ka fituar popullaritet në Runet, duke u bërë standardi i paracaktuar në bibliotekat dhe bibliotekat elektronike ruse. në vendet e CIS.

Disavantazhet e formatit

Thjeshtësia e formatit FB2 është avantazhi dhe disavantazhi i tij në të njëjtën kohë. Kjo kufizon funksionalitetin për paraqitjen komplekse të tekstit (për shembull, shënimet në margjina). Nuk ka grafikë vektoriale ose mbështetje për listat e numëruara. Për këtë arsye formati jo shumë i përshtatshëm për tekstet shkollore, librat e referencës dhe literaturën teknike (emri i formatit madje flet për këtë - libër fiksioni, ose "libër fiction").

Në të njëjtën kohë, për të shfaqur informacion minimal rreth librit - titull, autor dhe kopertinë - programi duhet të përpunojë pothuajse të gjithë dokumentin XML. Kjo është për shkak se meta të dhënat vijnë në fillim të tekstit dhe imazhet vijnë në fund.

FB3 - zhvillimi i formatit

Për shkak të kërkesave të shtuara për formatimin e teksteve të librave (dhe për të zbutur disa nga mangësitë e FB2), Gribov filloi punën në formatin FB3. Zhvillimi më vonë u ndal, por në vitin 2014 u ndal rifilloi.

Sipas autorëve, ata studiuan nevojat reale gjatë botimit të literaturës teknike, shikuan tekste shkollore, libra referencë, manuale dhe përshkruan një grup më specifik etiketash që do të lejonin shfaqjen e çdo libri.

Në specifikimin e ri, formati FictionBook është një arkiv zip në të cilin meta të dhënat, imazhet dhe teksti ruhen si skedarë të veçantë. Kërkesat për formatin e skedarit zip dhe konventat për organizimin e tij janë të specifikuara në standard ECMA-376, i cili përcakton Open XML.

U bënë një sërë përmirësimesh në lidhje me formatimin (hapësira, nënvizimi) dhe u shtua një objekt i ri - një "bllok" - i cili formaton një fragment arbitrar të një libri në formën e një katërkëndëshi dhe mund të futet në tekst me një mbështjellës. Tani ka mbështetje për listat e numëruara dhe me pika.

FB3 shpërndahet nën një licencë falas dhe është me burim të hapur, kështu që të gjitha shërbimet janë në dispozicion për botuesit dhe përdoruesit: konvertuesit, redaktuesit e cloud, lexuesit. Aktuale version format, lexues и redaktori mund të gjendet në depon e GitHub të projektit.

Në përgjithësi, FictionBook3 është ende më pak i përhapur se vëllai i tij më i madh, por disa biblioteka elektronike tashmë ofrojnë libra në këtë format. Dhe litra nja dy vjet më parë njoftuan qëllimin e tyre për të transferuar të gjithë katalogun e tyre në një format të ri. Disa lexues tashmë mbështesin të gjithë funksionalitetin e nevojshëm FB3. Për shembull, të gjitha modelet moderne të lexuesve ONYX mund të punojnë me këtë format jashtë kutisë, për shembull, Darvin 3 ose Kleopatra 3.

Librat elektronikë dhe formatet e tyre: FB2 dhe FB3 - historia, të mirat, të këqijat dhe parimet e punës
/ ONYX BOOX Kleopatra 3

Shpërndarja më e gjerë e FictionBook3 do të krijojë një ekosistem i orientuar për të punuar plotësisht dhe në mënyrë efektive me tekstin në çdo pajisje me burime të kufizuara: ekran bardh e zi ose i vogël, memorie të ulët, etj. Sipas zhvilluesve, një libër sapo të shtrohet do të jetë sa më i përshtatshëm në çdo mjedis.

PS Ne sjellim në vëmendjen tuaj disa rishikime të lexuesve të ONYX BOOX:



Burimi: www.habr.com

Shto një koment