Le informazioni del linguaggio stanno in un floppy disk

pubblicato in: AltroBlog 0
Le informazioni del linguaggio stanno in un floppy disk

I dati relativi al significato delle parole, alla loro occorrenza e al loro utilizzo occupano, nel
cervello, uno spazio equivalente a 1,5 megabyte di dati: meno di quanto si credesse.

02 APRILE 2019 | ELISABETTA INTINI – focus.it

Quando apprendiamo la nostra lingua madre, il cervello immagazzina tutte le informazioni che ci
occorrono per utilizzarla – dalla pronuncia dei fonemi alle regole della sintassi – in (appena!) 1,5
megabyte circa di dati: quanti ne custodiva un vecchio floppy disk. È quanto emerge da uno studio
pubblicato sulla rivista Royal Society Open Science, in cui due scienziati delle Università di
Rochester e della California hanno applicato i concetti della teoria dell’informazione per calcolare
il volume di dati necessari a custodire e utilizzare le varie componenti della lingua inglese.

VALORE AGGIUNTO. La teoria dell’informazione è un ramo della matematica che studia come un messaggio
viene codificato e i modi più efficienti per trasmetterlo. Uno dei concetti fondamentali su cui si
basa è l’entropia, intesa in questo caso come l’informazione media contenuta in ogni messaggio
trasmesso. Un messaggio prevedibile e che ha alta probabilità di essere emesso contiene poca
quantità di informazione, uno più inaspettato e poco probabile veicola una maggiore quantità di
informazione.

La quantità di informazione viene espressa in bit (che la teoria dell’informazione definisce come la
quantità minima di informazione che serve a discernere tra due eventi equiprobabili: in altre parole
equivale alla scelta tra due possibili valori – sì o no, vero o falso? – quando questi hanno la
stessa probabilità di essere scelti): ebbene gli scienziati hanno calcolato quanti bit occorrono per
codificare i vari aspetti della lingua inglese. Acquisire padronanza di una lingua implica molto di
più che memorizzare le semplici definizioni accanto al lemma di un dizionario. Ci sono le
informazioni associate alla pronuncia, quelle relative ai significati evocati da quella parola e le
regole sull’uso di quel termine: a quali altri si accompagna? Quando non può essere utilizzato?

LA CONTA DEI DATI. Gli scienziati hanno iniziato dai fonemi. Ce ne sono circa 50 nella lingua
inglese, e possiamo stimare che ciascuno richieda 15 bit: tutti insieme, i fonemi soltanto
richiedono circa 750 bit. Memorizzare le circa 40 mila parole che ogni madrelingua inglese conosce
richiede circa 400 mila bit, ma se si aggiunge la semantica, cioè la mole di informazioni relative a
ciascuna parola, si arriva a 12 milioni di bit.

Per semantica si intende «il pieno significato di una parola. Se ti dico “tacchino”, ci sono molte
informazioni che sai su di esso. Se sappia o meno volare, se sappia o meno camminare», spiega Frank
Mollica, tra gli autori. Ricordare con quale frequenza si presenti ogni parola richiede altri 80
mila bit; circa 700 ne servono per fare proprie le regole della sintassi. Fatti i conti, la stima
per l’apprendimento e l’uso della lingua inglese è di circa 1,56 megabyte: più o meno il necessario
per salvare una foto digitale (di qualità medio-alta).

royalsocietypublishing.org/doi/10.1098/rsos.181393

Condividi:

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *