Ηλεκτρονικά βιβλία και οι μορφές τους: FB2 και FB3 - ιστορία, πλεονεκτήματα, μειονεκτήματα και αρχές εργασίας

Στο προηγούμενο άρθρο, μιλήσαμε για χαρακτηριστικά της μορφής DjVu. Σήμερα αποφασίσαμε να εστιάσουμε στη μορφή FictionBook2, πιο γνωστή ως FB2, και στον «διάδοχό» του FB3.

Ηλεκτρονικά βιβλία και οι μορφές τους: FB2 και FB3 - ιστορία, πλεονεκτήματα, μειονεκτήματα και αρχές εργασίας
/flickr/ Judith Klein / CC

Η εμφάνιση της μορφής

Στα μέσα της δεκαετίας του 90, ενθουσιώδεις Ξεκινήσαμε ψηφιοποίηση σοβιετικών βιβλίων. Μετάφρασαν και συντήρησαν λογοτεχνία σε μεγάλη ποικιλία μορφών. Μία από τις πρώτες βιβλιοθήκες στο Runet - Βιβλιοθήκη του Maxim Moshkov — χρησιμοποίησε ένα μορφοποιημένο αρχείο κειμένου (.txt).

Η επιλογή υπέρ του έγινε λόγω της αντίστασης στη διαφθορά των byte και της ευελιξίας - το TXT ανοίγει σε οποιοδήποτε λειτουργικό σύστημα. Ωστόσο, αυτός εμπόδισε επεξεργασία αποθηκευμένων πληροφοριών κειμένου. Για παράδειγμα, για να μετακινηθείτε στη χιλιοστή γραμμή, έπρεπε να επεξεργαστείτε 999 γραμμές πριν από αυτήν. Βιβλία επίσης διατηρήθηκε σε έγγραφα "Word" και PDF - το τελευταίο ήταν δύσκολο να μετατραπεί σε άλλες μορφές και οι αδύναμοι υπολογιστές άνοιξαν και εκτεθειμένος Έγγραφα PDF με καθυστερήσεις.

Η HTML χρησιμοποιήθηκε επίσης για την «αποθήκευση» ηλεκτρονικής βιβλιογραφίας. Απλοποίησε την ευρετηρίαση, τη μετατροπή σε άλλες μορφές και τη δημιουργία εγγράφων (επισήμανση κειμένου), αλλά εισήγαγε τα δικά του μειονεκτήματα. Ένα από τα πιο σημαντικά ήτανασάφεια» πρότυπο: επέτρεψε ορισμένες ελευθερίες όταν έγραφε ετικέτες. Κάποια από αυτά έπρεπε να κλείσουν, άλλα (για παράδειγμα, ) - δεν ήταν απαραίτητο να κλείσει. Οι ίδιες οι ετικέτες θα μπορούσαν να έχουν μια αυθαίρετη σειρά ένθεσης.

Και παρόλο που μια τέτοια εργασία με αρχεία δεν ενθαρρύνθηκε - τέτοια έγγραφα θεωρήθηκαν λανθασμένα - το πρότυπο απαιτούσε από τους αναγνώστες να προσπαθήσουν να εμφανίσουν το περιεχόμενο. Εδώ προέκυψαν οι δυσκολίες, αφού σε κάθε εφαρμογή η διαδικασία της «σκέψης» υλοποιούνταν με τον δικό της τρόπο. Ταυτόχρονα, συσκευές και εφαρμογές για ανάγνωση ήταν διαθέσιμες στην αγορά εκείνη την εποχή κατανοητό μία ή δύο εξειδικευμένες μορφές. Εάν το βιβλίο ήταν διαθέσιμο σε μία μορφή, έπρεπε να διαμορφωθεί εκ νέου για να διαβαστεί. Για να λύσει όλες αυτές τις ελλείψεις και κλήθηκε Βιβλίο Μυθιστορήματος 2, ή FB2, που ανέλαβε το αρχικό «χτένισμα» του κειμένου και τη μετατροπή.

Σημειώστε ότι η μορφή είχε την πρώτη έκδοση − Βιβλίο Μυθιστορήματος 1 - ωστόσο, ήταν μόνο πειραματικό, δεν διήρκεσε πολύ, δεν υποστηρίζεται επί του παρόντος και δεν είναι συμβατό προς τα πίσω. Επομένως, το FictionBook σημαίνει συχνότερα τον «ακόλουθό» του - τη μορφή FB2.

Το FB2 δημιουργήθηκε από μια ομάδα ανάπτυξης με επικεφαλής τον Ντμίτρι Γκρίμποφ, ο οποίος είναι ο τεχνικός διευθυντής της εταιρείας λίτρων, και ο Mikhail Matsnev, ο δημιουργός του Haali Reader. Η μορφή βασίζεται σε XML, η οποία είναι πιο αυστηρή από την HTML στη ρύθμιση της εργασίας με μη κλειστές και ένθετες ετικέτες. Ένα έγγραφο XML συνοδεύεται από ένα λεγόμενο σχήμα XML. Ένα σχήμα XML είναι ένα ειδικό αρχείο που περιέχει όλες τις ετικέτες και περιγράφει τους κανόνες για τη χρήση τους (ακολουθία, ένθεση, υποχρεωτική και προαιρετική κ.λπ.). Στο FictionBook, το σχήμα βρίσκεται στο αρχείο FictionBook2.xsd. Ένα παράδειγμα σχήματος XML μπορεί να βρεθεί στο σύνδεσμος (χρησιμοποιείται από το e-book store λίτρων).

Δομή εγγράφου FB2

Κείμενο στο έγγραφο διατηρούνται σε ειδικές ετικέτες - στοιχεία τύπων παραγράφων: , Και . Υπάρχει και ένα στοιχείο , το οποίο δεν έχει περιεχόμενο και χρησιμοποιείται για την εισαγωγή κενών.

Όλα τα έγγραφα ξεκινούν με μια ετικέτα ρίζας , κάτω από το οποίο , , Και .

Ετικέτα περιέχει φύλλα στυλ για τη διευκόλυνση της μετατροπής σε άλλες μορφές. ΣΕ ψέμα κωδικοποιημένη με base64 δεδομένα που μπορεί να χρειαστούν για την απόδοση του εγγράφου.

Στοιχείο περιέχει όλες τις απαραίτητες πληροφορίες για το βιβλίο: το είδος του έργου, τη λίστα των συγγραφέων (πλήρες όνομα, διεύθυνση ηλεκτρονικού ταχυδρομείου και ιστότοπος στο Διαδίκτυο), τίτλος, μπλοκ με λέξεις-κλειδιά, σχολιασμός. Μπορεί επίσης να περιέχει πληροφορίες σχετικά με τις αλλαγές που έγιναν στο έγγραφο και πληροφορίες για τον εκδότη του βιβλίου, εάν είχε εκδοθεί σε χαρτί.

Έτσι φαίνεται το μπλοκ στην καταχώρηση FictionBook για έργα "Study in Scarlet" του Άρθουρ Κόναν Ντόιλ, βγαλμένο από Έργο Gutenberg:

<?xml version="1.0" encoding="iso-8859-1"?>
 <FictionBook 
  >
  <description>
    <title-info>
      <genre match="100">detective</genre>
      <author>
        <first-name>Arthur</first-name>
        <middle-name>Conan</middle-name>
        <last-name>Doyle</last-name>
      </author>
      <book-title>A Study in Scarlet</book-title>
      <annotation>
      </annotation>
      <date value="1887-01-01">1887</date>
    </title-info>
  </description>

Το βασικό συστατικό ενός εγγράφου FictionBook είναι . Περιέχει το πραγματικό κείμενο του βιβλίου. Μπορεί να υπάρχουν αρκετές από αυτές τις ετικέτες σε ολόκληρο το έγγραφο - χρησιμοποιούνται πρόσθετα μπλοκ για την αποθήκευση υποσημειώσεων, σχολίων και σημειώσεων.

Το FictionBook παρέχει επίσης αρκετές ετικέτες για την αντιμετώπιση υπερσυνδέσμων. Βασίζονται σε προδιαγραφές xLinkπου αναπτύχθηκε από την κοινοπραξία W3C ειδικά για τη δημιουργία συνδέσμων μεταξύ διαφορετικών πόρων σε έγγραφα XML.

Πλεονεκτήματα της μορφής

Το πρότυπο FB2 περιλαμβάνει μόνο το ελάχιστο απαιτούμενο σύνολο ετικετών (επαρκές για τη «διακόσμηση» της μυθοπλασίας), γεγονός που απλοποιεί την επεξεργασία του από τους αναγνώστες. Επιπλέον, σε περίπτωση άμεσης εργασίας του αναγνώστη με τη μορφή FB, ο χρήστης έχει την ευκαιρία να προσαρμόσει σχεδόν όλες τις παραμέτρους εμφάνισης.

Η αυστηρή δομή του εγγράφου σας επιτρέπει να αυτοματοποιήσετε τη διαδικασία μετατροπής από τη μορφή FB σε οποιαδήποτε άλλη. Η ίδια δομή καθιστά δυνατή την εργασία με μεμονωμένα στοιχεία εγγράφων - τη ρύθμιση φίλτρων από συγγραφείς βιβλίων, τίτλο, είδος κ.λπ. Για το λόγο αυτό, η μορφή FB2 έχει αποκτήσει δημοτικότητα στο Runet, καθιστώντας το προεπιλεγμένο πρότυπο στις ρωσικές ηλεκτρονικές βιβλιοθήκες και βιβλιοθήκες των χωρών της ΚΑΚ.

Μειονεκτήματα μορφής

Η απλότητα της μορφής FB2 είναι το πλεονέκτημα και το μειονέκτημά της ταυτόχρονα. Αυτό περιορίζει τη λειτουργικότητα για σύνθετη διάταξη κειμένου (για παράδειγμα, περιθωριακές σημειώσεις). Δεν διαθέτει διανυσματικά γραφικά και υποστήριξη για αριθμημένες λίστες. Για το λόγο αυτό, η μορφή όχι πολύ κατάλληλο για σχολικά βιβλία, βιβλία αναφοράς και τεχνική βιβλιογραφία (ακόμη και το ίδιο το όνομα της μορφής λέει αυτό - βιβλίο μυθοπλασίας ή "βιβλίο μυθοπλασίας").

Ταυτόχρονα, για να εμφανιστούν οι ελάχιστες πληροφορίες σχετικά με το βιβλίο - τίτλος, συγγραφέας και εξώφυλλο - το πρόγραμμα πρέπει να επεξεργαστεί σχεδόν ολόκληρο το έγγραφο XML. Αυτό συμβαίνει γιατί τα μεταδεδομένα βρίσκονται στην αρχή του κειμένου και οι εικόνες στο τέλος.

FB3 - ανάπτυξη μορφής

Σε σχέση με τις αυξημένες απαιτήσεις για τη μορφοποίηση κειμένων βιβλίων (και προκειμένου να εξομαλυνθούν ορισμένες από τις ελλείψεις του FB2), ο Gribov άρχισε να εργάζεται στη μορφή FB3. Αργότερα η ανάπτυξη σταμάτησε, αλλά το 2014 ήταν συνέχισε.

Σύμφωνα με τους συγγραφείς, μελέτησαν τις πραγματικές ανάγκες στη δημοσίευση τεχνικής βιβλιογραφίας, εξέτασαν σχολικά βιβλία, βιβλία αναφοράς, εγχειρίδια και περιέγραψαν ένα πιο συγκεκριμένο σύνολο ετικετών που θα επέτρεπε την εμφάνιση οποιουδήποτε βιβλίου.

Στη νέα προδιαγραφή, η μορφή FictionBook είναι ένα αρχείο zip που αποθηκεύει μεταδεδομένα, εικόνες και κείμενο σε ξεχωριστά αρχεία. Οι απαιτήσεις για τη μορφή αρχείου zip και τις συμβάσεις για την οργάνωσή του διευκρινίζονται στο πρότυπο ECMA-376Ένα που ορίζει το Open XML.

Έγιναν ορισμένες βελτιώσεις σχετικά με τη μορφοποίηση (διάστημα, υπογράμμιση) και προστέθηκε ένα νέο αντικείμενο - ένα "μπλοκ" - διαμορφώνοντας ένα αυθαίρετο κομμάτι του βιβλίου σε μορφή τετράγωνου και ικανό να ενσωματωθεί σε κείμενο με αναδίπλωση. Προστέθηκε υποστήριξη για αριθμημένες λίστες και λίστες με κουκκίδες.

Το FB3 διανέμεται με δωρεάν άδεια και έχει ανοιχτό κώδικα, επομένως όλα τα βοηθητικά προγράμματα είναι διαθέσιμα σε εκδότες και χρήστες: μετατροπείς, επεξεργαστές cloud, αναγνώστες. ρεύμα έκδοση μορφή, αναγνωστήριο и ο συντάκτης μπορεί να βρεθεί στο αποθετήριο του έργου στο GitHub.

Γενικά, το FictionBook3 εξακολουθεί να είναι λιγότερο κοινό από τον μεγαλύτερο αδερφό του, αλλά βιβλία σε αυτήν τη μορφή προσφέρονται ήδη από αρκετές ηλεκτρονικές βιβλιοθήκες. Και πριν από μερικά χρόνια, η Liters ανακοίνωσε την πρόθεσή της να μεταφέρει ολόκληρο τον κατάλογό της σε νέα μορφή. Ορισμένοι αναγνώστες υποστηρίζουν ήδη όλες τις απαραίτητες λειτουργίες FB3. Για παράδειγμα, όλα τα σύγχρονα μοντέλα αναγνώστη ONYX μπορούν να λειτουργήσουν με αυτήν τη μορφή εκτός συσκευασίας, για παράδειγμα, Δαρβίνος 3 ή Κλεοπάτρα 3.

Ηλεκτρονικά βιβλία και οι μορφές τους: FB2 και FB3 - ιστορία, πλεονεκτήματα, μειονεκτήματα και αρχές εργασίας
/ ONYX BOOX Cleopatra 3

Η ευρύτερη διανομή του FictionBook3 θα δημιουργήσει ένα οικοσύστημα που προσανατολισμένη για ολοκληρωμένη και αποτελεσματική εργασία με κείμενο σε οποιαδήποτε συσκευή με περιορισμένους πόρους: ασπρόμαυρη ή μικρή οθόνη, χαμηλή μνήμη, κ.λπ. Σύμφωνα με τους προγραμματιστές, ένα βιβλίο που μόλις διαμορφωθεί θα είναι όσο το δυνατόν πιο βολικό σε οποιοδήποτε περιβάλλον.

Υ.Γ. Φέρνουμε στην προσοχή σας αρκετές κριτικές των αναγνωστών ONYX BOOX:



Πηγή: www.habr.com

Προσθέστε ένα σχόλιο