The article discusses two examples of how current digital encoding technologies misrepresent non-Western scripts, namely the graphical systems of India (Devánāgarī) and the Middle East (Arabic). Digital encodings such as Unicode inherit three rigid principles from print: (A) 1 ↔ 1, one grapheme corresponds to one letter; (B) 1 = 1, all graphemes (e.g. vowels, consonants) have the same status; (C) 1, 2, 3…, writing is a sequence of elements all on the same "level". These principles, however, did not apply to handwritten medieval European graphic systems and do not apply today to non-western ones, including their print version. In Devánāgarī, some vowels are written before the consonant that they represent; in European medieval writing systems and in Arabic, diacritics orbit around (above, under or after) base graphemes. In order to provide a digital encoding of those writing systems accordingly to the cultures they belong to, such diacritics should be provided with a special status, distinguishing them from (and linking them to) their base graphemes. In the case of Arabic, ḥarakāt are added above or below a consonant to specify the short vowel with which it should be pronounced. Since in Arabic a word is identified by its consonants and long vowels only, ḥarakāt are optional diacritics. The pronunciation of vowels varies largely in time and space among the Arabic-speaking world. A word is the same word from Morocco to Iraq only as long as one only writes its consonants and long vowels, i.e. only within the structure of the Arabic script. Current text encoding technologies fail to represent the optional and relative nature of ḥarakāt. Thus, they make short vowels semiotically pertinent at the same level of consonants. This has potential practical, cultural and social implications in the self-representation of the cultural unity of the Arabic-Islamic world.

L'articolo discute due esempi di come le attuali tecnologie di codifica digitale rappresentino in modo errato gli script non occidentali, in particolare i sistemi grafici dell'India (Devánāgarī) e del Medio Oriente (arabo). Le codifiche digitali come Unicode ereditano tre rigidi principi dalla stampa: (A) 1 ↔ 1, un grafema corrisponde a una lettera; (B) 1 = 1, tutti i grafemi (es. Vocali, consonanti) hanno lo stesso stato; (C) 1, 2, 3…, la scrittura è una sequenza di elementi tutti sullo stesso "livello". Questi principi, tuttavia, non si applicavano ai sistemi grafici europei medievali scritti a mano e non si applicano oggi a quelli non occidentali, compresa la loro versione stampata. In Devánāgarī, alcune vocali sono scritte prima della consonante che rappresentano; nei sistemi di scrittura medievali europei e in arabo, i segni diacritici orbitano attorno (sopra, sotto o dopo) i grafemi di base. Al fine di fornire una codifica digitale di tali sistemi di scrittura in base alle culture a cui appartengono, tali segni diacritici dovrebbero essere dotati di uno status speciale, distinguendoli (e collegandoli) ai loro grafemi di base. Nel caso dell'arabo, ḥarakāt sono aggiunti sopra o sotto una consonante per specificare la vocale breve con cui dovrebbe essere pronunciata. Poiché in arabo una parola è identificata solo dalle consonanti e dalle vocali lunghe, ḥarakāt sono segni diacritici opzionali. La pronuncia delle vocali varia ampiamente nel tempo e nello spazio nel mondo di lingua araba. Una parola è la stessa parola dal Marocco all'Iraq solo finché si scrivono solo le sue consonanti e vocali lunghe, cioè solo all'interno della struttura della scrittura araba. Le attuali tecnologie di codifica del testo non riescono a rappresentare la natura opzionale e relativa di ḥarakāt. Quindi, fanno vocali brevi semioticamente pertinenti allo stesso livello di consonanti. Ciò ha potenziali implicazioni pratiche, culturali e sociali nell'auto-rappresentazione dell'unità culturale del mondo arabo-islamico.

Monella, P. (2020). Scritture dimenticate, scritture colonizzate: sistemi grafici e codifiche digitali. In D. Fiormonte, P. Sordi (a cura di), Letteratura e altre rivoluzioni. Scritti per Raul Mordenti (pp. 242-263). Roma : Bordeaux edizioni.

Scritture dimenticate, scritture colonizzate: sistemi grafici e codifiche digitali

Monella, Paolo
2020-01-01

Abstract

The article discusses two examples of how current digital encoding technologies misrepresent non-Western scripts, namely the graphical systems of India (Devánāgarī) and the Middle East (Arabic). Digital encodings such as Unicode inherit three rigid principles from print: (A) 1 ↔ 1, one grapheme corresponds to one letter; (B) 1 = 1, all graphemes (e.g. vowels, consonants) have the same status; (C) 1, 2, 3…, writing is a sequence of elements all on the same "level". These principles, however, did not apply to handwritten medieval European graphic systems and do not apply today to non-western ones, including their print version. In Devánāgarī, some vowels are written before the consonant that they represent; in European medieval writing systems and in Arabic, diacritics orbit around (above, under or after) base graphemes. In order to provide a digital encoding of those writing systems accordingly to the cultures they belong to, such diacritics should be provided with a special status, distinguishing them from (and linking them to) their base graphemes. In the case of Arabic, ḥarakāt are added above or below a consonant to specify the short vowel with which it should be pronounced. Since in Arabic a word is identified by its consonants and long vowels only, ḥarakāt are optional diacritics. The pronunciation of vowels varies largely in time and space among the Arabic-speaking world. A word is the same word from Morocco to Iraq only as long as one only writes its consonants and long vowels, i.e. only within the structure of the Arabic script. Current text encoding technologies fail to represent the optional and relative nature of ḥarakāt. Thus, they make short vowels semiotically pertinent at the same level of consonants. This has potential practical, cultural and social implications in the self-representation of the cultural unity of the Arabic-Islamic world.
2020
Settore L-FIL-LET/05 - Filologia Classica
Monella, P. (2020). Scritture dimenticate, scritture colonizzate: sistemi grafici e codifiche digitali. In D. Fiormonte, P. Sordi (a cura di), Letteratura e altre rivoluzioni. Scritti per Raul Mordenti (pp. 242-263). Roma : Bordeaux edizioni.
File in questo prodotto:
File Dimensione Formato  
29.monella2020scritture.pdf

Solo gestori archvio

Descrizione: Full text dell'articolo, versione pubblicata
Tipologia: Versione Editoriale
Dimensione 226.92 kB
Formato Adobe PDF
226.92 kB Adobe PDF   Visualizza/Apri   Richiedi una copia

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10447/434995
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact