Apostolos\’ Daily Plate

Η βασική διαφορά του LaTeX με το XeLaTeX

Posted in Πληροφορική by asyropoulos on 5 Απριλίου, 2021

Στους υπολογιστές όλα τα σύμβολα που μπορούν να πληκτρολογηθούνονομάζονται χαρακτρήρες. Ο κάθε χαρακτήρας αναπαριστάνεται εσωτερικά με έναν αριθμό. Το byte είναι βασική μονάδα μέτρησης όγκου πληροφοριών. Ένα byte μπορεί να αναπαραστήσει όλους τους ακεραίους αριθμούς από το 0 ως το 255 (μπορεί και όλους τους αριθμούς από το -127 ως +128 αλλά αυτό δεν μας αφορά εδώ). Στις αρχές της πληροφορικής οι χαρακτήρεςπου αναγνωρίζει ένας Η/Υ ήταν πολλοί λίγοι: τα αγγλικά γράμματα (πεζά και κεφαλαία), τα ψηφιά, τα σύμβολα στίξης και μερικά ακόμη σύμβολα και χαρακτήρες ελέγχου. Όλοι αυτοί οι χαρακτήρες σχηματίζουν ένα σύμβολοτο οποίο είναι γνωστό ως ASCII. Με την εξάπλωση των Η/Υ στη δεκαετία του 1980 έγινε κατανοητό πως οι Η/Υ (ουσιαστικά τα λειτουργικά συστήματα) έπρεπε να  υποστηρίζουν και άλλους χαρακτήρες. Έτσι οι Η/Υ στην Ελλάδα υποστήριζαν  τους αρχικούς χαρακτήρες του ASCII συν τους μονοτονικούς ελληνικούς χαρακτήρες. Αυτή η (αναγκαστική;) επιλογή είχε ένα βασικό μειονέκτημα: Έκανε δύσκολη ως αδύνατη την επικοινωνία στα ελληνικά, αραβικά κ.λπ. μεταξύ ανθρώπων που ζούσαν σε διαφορετικές χώρες. Επιπλέον, δεν ήταν καθόλου εύκολο ένα κείμενο να περιέχει παραπομπές γραμμένες σε 3 ή περισσότερες γραφές (σκεφτείτε τη συσκευασία ενός σύγχρονου προϊόντος και δείτε σε πόσες γραφές είναι γραμμένα τα συστατικά). Για να δωθεί λύση σε αυτά αλλά και άλλα συναφή προβήματα, ένα consortium εταιρειών πληροφορικής έφτιαξε το Unicode Consortium. Αυτό με τη σειρά του δημιούργησε το προτυπο Unicode το οποίο επιτρέπει στα Λ/Σ να αναπαριστάνουν σήμερα πάνω από 100.000 χαρακτήρες!

Το TeX είναι ένα πρόγραμμα που δημιουργήθηκε πριν το Unicode. Οπότε σχεδιάστηκε με βάση την υπόθεση ότι ένας Η/Υ μπορεί να «δουλεύει» με το πολύ 256 χαρακτήρες. Έτσι και οι γραμματοσειρές που χρησιμοποιούσε μπορούσαν να έχουν το πολύ 256 χαρακτήρες. Το ίδιο φυσικά ισχύει και για το pdfTeX το οποίο είναι ίδιο με το TeX απλά παράγει αρχεία PDF απευθειας. Το πακέτο inputenc με την επιλογές utf-8 επιτρέπει στο LaTeX να επεξεργάζεται αρχεία κωδικοποιημένα στην κωδικοποίηση UTF-8 του Unicode σε επίπεδο μακροεντολών. Δηλαδή θεωρεί όλες τις δυάδες από byte τα οποία αναπαριστάνουν χαρακτήρες Unicode ως εντολές και τα αντιστοιχεί σε γλυφές συγκεκριμένων γραμματοσειρών. Ποια συγκεκριμένα σε στις γραμματοσειρές που θεωρούνται οι κύριες γραμματοσειρές κάθε γλώσσας και έχουν κωδικοποιηθεί με βάση κάποια συγκεκριμένη κωδικοποίηση 1 byte ανά χαρακτήρα.

To XeTeX είναι μια επέκταση του TeX που μπορεί να επεξεργαστεί απευθείας αρχεία κωδικοποιημένα στην UTF-8. Αυτό σημαίνει ότι αυτόματα μπορεί να χρησιμοποιήσει μια γραμματοσειρά που περιέχει ως 100.000 γλυφές! Οπότε είναι τεράστιο λάθος να χρησιμοποιούμε το πακέτο inputenc με το XeLaTeX. Γενικότερα είναι απλά χάσιμο χρόνου να χρησιμοποιούμε το LaTeX και όχι το XeLaTeX ή ακόμη κι το LuaLateX. Άλλωστε το ένα ακόμη όφελος είναι η δυνατότητα χρήσεις γραμματοσειρών OpenType και TrueType, η αυτόματη εναλλαγή χρήσης κανόνων συλλαβισμού, η χρήση μαθηματικών γραμματοσρειρών τύπου OpenType και TrueType κ.λπ.

Σχολιάστε

Εισάγετε τα παρακάτω στοιχεία ή επιλέξτε ένα εικονίδιο για να συνδεθείτε:

Λογότυπο WordPress.com

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό WordPress.com. Αποσύνδεση /  Αλλαγή )

Φωτογραφία Google

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Google. Αποσύνδεση /  Αλλαγή )

Φωτογραφία Twitter

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Twitter. Αποσύνδεση /  Αλλαγή )

Φωτογραφία Facebook

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Facebook. Αποσύνδεση /  Αλλαγή )

Σύνδεση με %s

Αρέσει σε %d bloggers: