La composizione di alcune lingue orientali con il sistema TEX Claudio Beccari g u It meeting 2017
Premessa In questa presentazione descriverò come usare i programmi del sistema TEX per comporre citazioni o interi documenti in lingue orientali. Claudio Beccari () Lingue orientali g u It 2017 2/26
Premessa In realtà mi limiterò a parlare solo di tre lingue: l arabo perché si scrive da destra a sinistra e si scrive con caratteri calligrafici legati gli uni agli altri; Claudio Beccari () Lingue orientali g u It 2017 3/26
Premessa In realtà mi limiterò a parlare solo di tre lingue: l arabo perché si scrive da destra a sinistra e si scrive con caratteri calligrafici legati gli uni agli altri; il giapponese perché si scrive con quattro sistemi di scrittura, da sinistra a destra e dall alto al basso; Claudio Beccari () Lingue orientali g u It 2017 3/26
Premessa In realtà mi limiterò a parlare solo di tre lingue: l arabo perché si scrive da destra a sinistra e si scrive con caratteri calligrafici legati gli uni agli altri; il giapponese perché si scrive con quattro sistemi di scrittura, da sinistra a destra e dall alto al basso; il coreano che usa un alfabeto diverso da quello latino, ma che raggruppa i segni alfabetici in segni complessi, simili ad ideogrammi, ognuno dei quali rappresenta una sillaba. Claudio Beccari () Lingue orientali g u It 2017 3/26
Premessa In realtà mi limiterò a parlare solo di tre lingue: l arabo perché si scrive da destra a sinistra e si scrive con caratteri calligrafici legati gli uni agli altri; il giapponese perché si scrive con quattro sistemi di scrittura, da sinistra a destra e dall alto al basso; il coreano che usa un alfabeto diverso da quello latino, ma che raggruppa i segni alfabetici in segni complessi, simili ad ideogrammi, ognuno dei quali rappresenta una sillaba. Penso che questi tre metodi di scrittura siano, mutatis mutandis, dei paradigmi per molte lingue orientali. Claudio Beccari () Lingue orientali g u It 2017 3/26
Premessa Vorrei sottolineare che ho qualche minima esperienza nello scrivere in queste lingue esotiche con i programmi del sistema TEX, segnatamente pdflatex, XeLaTeX e LuaLaTeX. Ma io non ne conosco nessuna Non sono un orientalista; non sono un linguista; faccio solo parte di quel gruppo di persone che, dai tempi di Seneca, sono definiti vili meccanici. Claudio Beccari () Lingue orientali g u It 2017 4/26
L arabo Come noto l arabo si scrive da destra a sinistra. La scrittura anche a stampa è calligrafica con lettere legate, al punto che ogni lettera dispone di quattro segni. 1 Lettera isolata. 2 Lettera iniziale. 3 Lettera mediana. 4 Lettera finale. Non tutte le lettere hanno tutte e quattro quelle forme. Claudio Beccari () Lingue orientali g u It 2017 5/26
Scrittura consonantica dell arabo Come quasi tutte le lingue semitiche i segni semantici sono le consonanti; le vocali vengono usate raramente; la vocalizzazione viene però sempre indicata, insieme ai segni melodici, per la lettura del Corano, sia perché è scritto nella lingua usata un dozzina di secoli fa e non è più parlata oggigiorno, sia perché la lettura melodica è una parte importante della lettura coranica durante le preghiere nelle moschee. Claudio Beccari () Lingue orientali g u It 2017 6/26
L alfabeto arabo L alfabeto araba è costituito da 28 (o 29?) lettere che rappresentano sostanzialmente delle consonanti. Claudio Beccari () Lingue orientali g u It 2017 7/26
Scrittura coranica Typesetting Arabic and Farsi with the The Users Guide package Claudio Beccari () Lingue orientali g u It 2017 8/26
La scrittura con il sistema TEX Come si fa a scrivere con il sistema TEX una lingua così calligrafica, per giunta senza disporre di una tastiera latino/araba? Per scrivere e-mail la comune tastiera latino/araba va bene perché usa solamente le forme delle lettere isolate. Disponendo di adeguati font OpenType che possono lavorare con le legature, che talvolta implicano legature fino a cinque caratteri di seguito, si riesce anche a scrivere testo arabo in modo decoroso. Ma per fare questo non si può usare pdflatex, ma bisogna usare solamente LuaLaTeX o, in subordine, XeLaTeX. Oggi consiglierei di usare solamente LuaLaTeX insieme al pacchetto arabluatex. Claudio Beccari () Lingue orientali g u It 2017 9/26
La scrittura con arabluatex Con il pacchetto citato (consigliato anche agli arabi stessi) si immette nel file sorgente.tex il testo da comporre usando solo caratteri ascii: lettere minuscole e maiuscole, segni di interpunzione e altri segni analfabetici, cifre; i segni analfabetici svolgono la funzione di segni diacritici; Il file.tex viene poi automaticamente elaborato da un modulo Lua esterno e composto con caratteri arabi; infine il risultato viene ridato in pasto a LuaLaTeX che lo immette nel file PDF di uscita. Devo aggiungere che per fare questo è necessario che la propria installazione di LuaLaTeX sia configurata per usare l opzione di sistema --shell-escape. Claudio Beccari () Lingue orientali g u It 2017 10/26
د ص ت أ ج ر أ ف ر س Un esempio preso dalla documentazione و ف س ح ق أ ن أ س ت أ د ج ن أ م ر أ غ ص ط إ د ص ع أ م ح س م أ ة ف ق ا ل ل ه : إ ل ى ى ي ق ج ح ا ي ط ل ب م ن ه م ح ا ر ه ل ي ب رك ه ف ي ة ق ر ص ي ي د ه إ ل ي ك ف ي ا ل م س آ ء و ف أ د ع ل ك ة. ا ل ي و م. و ق ب ل ي ط ي ع ل ا ن أ ي ا ا آ س ف ن أ ج ح ا : ف ق ا ل ت م ي ن ه ق. ف ق ا ل ل ه ج ح ا : ج ح ا ك ل ا م ه ب د أ ا ل ح م ا ر ي ن ه ق ف ي ب ل ه. ف ق ا ل ل ه د ص ي ق ه : ق ل ك ر غ ب ت ك ف ا ل ح م ا ر ل ي س ه ن ا ع إ ن ي ك ي ا ر ي ب ي ق ي أ ت د ص ق ا ل ح م ا ر و ت ك ذ ب ن ي ج ح ا ا ر ك ي ا Claudio Beccari () Lingue orientali g u It 2017 11/26
Altro esempio preso dalla documentazione h i ح ر و ف ح ر و ف ا ل ه ج آ ء ح ر و ف ا ل م ع م ج ا ل ح ر و ف ا ل ه ج آ ئ ة ي ا ل ت ه ي ج Si noti che la frase citata in arabo va comunque letta da destra a sinistra, ma va a capo in modo coerente. Claudio Beccari () Lingue orientali g u It 2017 12/26
Comporre in giapponese Il giapponese usa quattro sistemi di scrittura: il sillabario hiragana (in uso da circa 10 secoli) dove ogni segno rappresenta una sillaba; Claudio Beccari () Lingue orientali g u It 2017 13/26
Comporre in giapponese Il giapponese usa quattro sistemi di scrittura: il sillabario hiragana (in uso da circa 10 secoli) dove ogni segno rappresenta una sillaba; il sillabario katakana (in uso da poco più di un secolo) serve essenzialmente per la traslitterazione di nomi stranieri; Claudio Beccari () Lingue orientali g u It 2017 13/26
Comporre in giapponese Il giapponese usa quattro sistemi di scrittura: il sillabario hiragana (in uso da circa 10 secoli) dove ogni segno rappresenta una sillaba; il sillabario katakana (in uso da poco più di un secolo) serve essenzialmente per la traslitterazione di nomi stranieri; la collezione degli ideogrammi cinesi kanji (in uso da alcuni secoli) per il testo destinato alla lettura delle persone ragionevolmente colte; Claudio Beccari () Lingue orientali g u It 2017 13/26
Comporre in giapponese Il giapponese usa quattro sistemi di scrittura: il sillabario hiragana (in uso da circa 10 secoli) dove ogni segno rappresenta una sillaba; il sillabario katakana (in uso da poco più di un secolo) serve essenzialmente per la traslitterazione di nomi stranieri; la collezione degli ideogrammi cinesi kanji (in uso da alcuni secoli) per il testo destinato alla lettura delle persone ragionevolmente colte; l alfabeto latino romaji usato quando non se ne può fare a meno. Claudio Beccari () Lingue orientali g u It 2017 13/26
Lo shell-editor Per gestire i file sorgente che contengano un po di giapponese (o di coreano) bisogna disporre di uno shell-editor che sappia gestire font UNICODE e che sia configurato con un suo font che ne contenga i caratteri. Sul Mac il font Monaco va benissimo. Inoltre bisogna che il sistema operativo fornisca un driver che permetta di accedere in qualche modo ai caratteri orientali. Sul Mac si dispone di un driver di tastiera che permette di inserire i caratteri giapponesi usando i tasti latini. Ne mostrerò il funzionamento più avanti. Sembra che l editor Yudit, di cui si parlerà in un altra presentazione, sia in grado di inserire tali caratteri disegnandoli su una speciale finestrina della sua schermata. Claudio Beccari () Lingue orientali g u It 2017 14/26
Composizione orizzontale o verticale Normalmente il giapponese si scrive in righe orizzontali che si leggono da sinistra a destra (scrittura yoko); le parole non sono separate da spazi come quando si scrive in romaji e le parole vengono spezzate in fin di riga senza trattino di cesura. In testi tradizionali e/o formali, si scrive in righe verticali, che si leggono dall alto in basso e si susseguono da destra a sinistra (scrittura tate). Claudio Beccari () Lingue orientali g u It 2017 15/26
Esempio di scrittura yoko Sorgente yoko Testo in orizzontale\par\bigskip \vbox{\hsize=35mm \yoko\noindent 人人生而自由, 在尊嚴和權利上一律平等 } Risultato Testo in orizzontale 人人生而自由, 在尊嚴和權利上一律平等 Claudio Beccari () Lingue orientali g u It 2017 16/26
Esempio di scrittura tate Sorgente tate Testo in verticale\par\bigskip \vbox{\hsize=35mm \tate\noindent 人人生而自由, 在尊嚴和權利上一律平等 } Risultato 人人生而自由 在尊嚴和權利上一律平等 權人利人上生一而律自平由 等在 尊嚴和 Claudio Beccari () Lingue orientali g u It 2017 17/26
Come impostare i font Ovviamente per ottenere questi risultati con LuaLaTeX bisogna invocare una versione speciale di fontspec che si chiama luatexja-fontspec: Gestore dei font \usepackage{luatexja-fontspec} \defaultfontfeatures{ligatures=tex} Inoltre bisogna caricare font OpenType che contengano i caratteri giapponesi, per esempio (sul mio Mac): Esempio di font per il giapponese \newjfontfamily{\japanesefont}{hiragino Mincho Pro} Claudio Beccari () Lingue orientali g u It 2017 18/26
La tastiera Come si vede non è particolarmente difficile comporre in giapponese. La difficoltà sta tutta nei mezzi di input dei vari grafemi, in sostanza nella tastiera. Il problema può avere diverse soluzioni su macchine diverse, dotati di sistemi operativi diversi. Qui mostro come fare sul Mac dotato di un sistema operativo recente. Claudio Beccari () Lingue orientali g u It 2017 19/26
Comporre in coreano Il coreano si scrive normalmente in righe orizzontali con le parole spaziate e con simboli che sembrano ideogrammi; non lo sono, ma ogni simbolo indica una sillaba i cui segni costituenti rappresentano singoli fonemi. In sostanza i segni elementari del coreano, detti jamo, formano un alfabeto di 24 lettere o poco più. La tastiera coreana contiene 26 tasti per i singoli jamo; secondo alcuni studiosi potrebbero essere 29 segni. Ma questo è relativamente poco importante ai nostri fini. L importante è che si tratta di un numero limitato di segni, come l alfabeto latino. Claudio Beccari () Lingue orientali g u It 2017 20/26
La tastiera coreana Claudio Beccari () Lingue orientali g u It 2017 21/26
Comporre in coreano Quando si scrive sulla tastiera coreana i singoli jamo vengono via via assemblati in sillabe secondo regole grafiche specifiche che implicano di fatto delle legature sostitutive a cui provvede direttamente il driver della tastiera. Ogni sillaba forma un disegno iscritto in un quadrato per cui le varie sillabe si susseguono in serie estremamente regolari. Esempio di testo coreano.. Claudio Beccari () Lingue orientali g u It 2017 22/26
La parola hangul Claudio Beccari () Lingue orientali g u It 2017 23/26
Font coreani Per poter effettivamente tipocomporre in coreano bisogna disporre dei font adatti; occorrono fon OpenType che abbiano la caratteristica di contenere anche lo script hangul. Bisogna stare molto attenti a scegliere i font, perché se anche sono etichettati come font CJK (Chinese Japanese Korean), non necessariamente contengono anche i simboli della scrittura hangul. Personalmente, per comporre l articolo ho dovuto scaricare dalla rete il font UnBatang.ttf. Font coreano \newjfontfamily{\koreanfont}{unbatang} Claudio Beccari () Lingue orientali g u It 2017 24/26
Altre informazioni L articolo su ArsTEXnica è stato composto con LuaLaTeX, così come questa presentazione. Capisco che il nome del programma può essere nuovo per alcune persone che conoscono LaTeX e pdflatex. Ma non c è da spaventarsi; il linguaggio è praticamente lo stesso, solo che LuaLaTeX fa più cose degli altri programmi del sistema TEX più noti. Le uniche differenze consistono nella gestione delle lingue e in quella dei font; la documentazione si legge aprendo un terminale e dando l uno o l altro dei seguenti comandi: texdoc polyglossia texdoc fontspec e/o texdoc luatexja-fontspec. Claudio Beccari () Lingue orientali g u It 2017 25/26
ありがとー誤差いました Buon lavoro con LuaL A TEX