Un sistema di AI traduce i pensieri direttamente in discorso parlato

Una tecnologia che abbina sintetizzatori e intelligenza artificiale converte le onde cerebrali della
corteccia uditiva in parole comprensibili a un utente esterno. Il sogno a lungo termine è arrivare a fare altrettanto con i discorsi soltanto immaginati.

11 FEBBRAIO 2019 | ELISABETTA INTINI – focus.it

Un gruppo di neuroscienziati della Columbia University ha creato un’interfaccia capace di tradurre
quanto udito da un paziente in un discorso scandito da un sintetizzatore vocale, ben comprensibile a
un ascoltatore esterno. Si tratta di un passo importante che potrebbe aprire la strada a nuove forme
di comunicazione mediate da computer per le persone impossibilitate a parlare, perché affette da malattie neurodegenerative o reduci da lesioni cerebrali.

LA SVOLTA DELL’AI. Lo studio, descritto su Scientific Reports, è stato possibile grazie a un sistema
di intelligenza artificiale che ha imparato a riconoscere i tratti ricorrenti delle onde cerebrali e
a tradurle in parola. Ogni volta che parliamo o immaginiamo di parlare, infatti, il cervello produce
schemi caratteristici di onde cerebrali, e lo stesso succede quando ascoltiamo qualcuno che parla, o immaginiamo di ascoltare.

Finora i tentativi di decodificare le onde cerebrali si basavano sull’analisi computerizzata di
spettrogrammi – le rappresentazioni grafiche delle frequenze sonore – ma i risultati lasciavano a
desiderare. Nima Mesgarani, primo autore dello studio, ha pensato invece di utilizzare un vocoder,
un sistema che produce linguaggio parlato dopo essersi “istruito” su registrazioni di persone che
parlano. «È la stessa tecnologia utilizzata da Amazon Echo e da Siri per fornire risposte verbali alle nostre domande», spiega.

DALL’ASCOLTO ALLA PAROLA. Per addestrare il vocoder, Mesgarani ha collaborato con un neurochirurgo
che trattava pazienti epilettici, coinvolti in interventi di routine. Gli elettrodi impiantati nel
cervello di questi pazienti a scopo terapeutico hanno anche permesso di registrare la loro attività cerebrale mentre ascoltavano brevi storie narrate da quattro diversi lettori.

A questo punto, quando l’algoritmo del vocoder era ormai sufficientemente “allenato”, gli stessi
pazienti hanno ascoltato uno speaker che pronunciava i numeri da 0 a 9. Il vocoder ha analizzato le
onde cerebrali prodotte nella loro corteccia uditiva, e le ha usate per tradurre in parola quei
pensieri che aveva “ascoltato” . Il suono prodotto è stato analizzato e ripulito da un sistema di
reti neurali, un tipo di AI che imita struttura e funzionalità dei neuroni nel cervello umano.
Ascoltatori esterni hanno riconosciuto i numeri elencati dalla voce robotica nel 75% dei casi, la prova che il segnale era ben riconoscibile.

UN PONTE PER COMUNICARE. I prossimi passi saranno testare il sistema con frasi più articolate, ma
soprattutto provarlo con i segnali cerebrali emessi quando una persona parla, prova a parlare o
immagina di parlare. Se funzionasse, si potrebbe immaginare che in futuro – si parla di un decennio
almeno -, un impianto (invasivo) a base di elettrodi cerebrali simile a quello di alcuni pazienti
epilettici permetterà di tradurre i pensieri del paziente direttamente in parole.
https://www.nature.com/articles/s41598-018-37359-z#Abs1

Cookie	Durata	Descrizione
CONSENT	2 years	YouTube sets this cookie via embedded youtube-videos and registers anonymous statistical data.
uid	5 months 27 days	This is a Google UserID cookie that tracks users across various website segments.
_ga	2 years	The _ga cookie, installed by Google Analytics, calculates visitor, session and campaign data and also keeps track of site usage for the site's analytics report. The cookie stores information anonymously and assigns a randomly generated number to recognize unique visitors.
_gid	1 day	Installed by Google Analytics, _gid cookie stores information on how visitors use a website, while also creating an analytics report of the website's performance. Some of the data that are collected include the number of visitors, their source, and the pages they visit anonymously.
__gads	1 year 24 days	The __gads cookie, set by Google, is stored under DoubleClick domain and tracks the number of times users see an advert, measures the success of the campaign and calculates its revenue. This cookie can only be read from the domain they are set on and will not track any data while browsing through other sites.

Cookie	Durata	Descrizione
fr	3 months	Facebook sets this cookie to show relevant advertisements to users by tracking user behaviour across the web, on sites that have Facebook pixel or Facebook social plugin.
IDE	1 year 24 days	Google DoubleClick IDE cookies are used to store information about how the user uses the website to present them with relevant ads and according to the user profile.
pxs	5 months 27 days	This cookie is used for targeting and advertising, and to optimise and manage digital advertising programmes.
test_cookie	15 minutes	The test_cookie is set by doubleclick.net and is used to determine if the user's browser supports cookies.
VISITOR_INFO1_LIVE	5 months 27 days	A cookie set by YouTube to measure bandwidth that determines whether the user gets the new or old player interface.
YSC	session	YSC cookie is set by Youtube and is used to track the views of embedded videos on Youtube pages.

Cookie	Durata	Descrizione
adImpCount	past	No description
fc	5 months 27 days	No description available.
GoogleAdServingTest	session	No description
pf	past	No description
wpcom_highlander_3pc_check	session	No description

Articoli correlati:

Lascia un commento Annulla risposta