The GRID

pubblicato in: AltroBlog 0

The grid

di: Alessio Mannucci – ecplanet.net

DATA INTENSIVE

Il vero capitale di ogni impresa industriale e commerciale è l’informazione, ovvero le conoscenze
che questa impresa possiede e che oggi non è in grado di sfruttare a pieno per mancanza di mezzi di
calcolo e di trattamento dati adeguati. Ormai da qualche anno si parla infatti di “Data Intensive”,
sistemi in grado di analizzare quantità di dati di dimensioni sempre più grandi che causano il
problema dell’ “information overload” (il sovraccarico di informazione).

Quando, nel 2006, il nuovo acceleratore di particelle LHC, attualmente in costruzione a Ginevra,
entrerà in funzione, ci sarà bisogno di acquisire, trattare, immagazzinare e distribuire una massa
di dati sperimentali enorme.

Le attuali stime prevedono qualcosa come 10’000’000 Gbyte per anno, ovvero 10 Peta Byte per anno (1
PetaByte =1000*Tera Byte, 1Tera Byte=1000 Giga Byte, 1 Giga Byte è la capacita del disco di un PC di
qualche anno fa, oggi la capacità media degli hard-disk casalinghi è di 10-20 Giga Byte. 1 Peta Byte
corrisponde alla capacità di memorizzazione di una pila di CD alta 1 miglio).

Per far fronte a questa mole di dati e di corrispondenti bisogni di calcolo con i metodi
convenzionali ci sarebbe bisogno di ampliare il centro di calcolo del CERN di 100-1000 volte. Questo
è tecnicamente, finanziariamente e politicamente molto difficile, praticamente impossibile. Gli
esperti del CERN, in collaborazione con i fisici di tutto il mondo, hanno quindi elaborato negli
ultimi due-tre anni un modello di calcolo distribuito che si è poi trovato a corrispondere
perfettamente ad una nuova tecnologia informatica che alcuni ricercatori avevano indipendentemente
sviluppato in USA. Questa tecnologia sia chiama in inglese “The Grid”, in analogia alla rete di
distribuzione elettrica, in inglese “Power Grid”.

L’analogia è particolarmente indovinata per vari motivi: la “Computing Grid”, come la rete
elettrica, vuole rendere l’accesso ad un servizio, in questo caso la potenza di calcolo,
praticamente illimitato, disponibile dovunque ci sia una connessione Internet, di accesso facile ed
immediato (come inserire una presa nel muro), che nasconda la complessità della gestione e
produzione delle risorse corrispondenti all’utente finale (così come un utente elettrico non vede la
complessità del processo di produzione e distribuzione della corrente elettrica).

In termini più pratici, si tratta di cercare di connettere tutti i calcolatori di una specifica
“Organizzazione Virtuale”, creando l’illusione di disporre di un unico centro di calcolo di potenza
quasi illimitata e di accesso facile ed immediato. Dato che la Grid per i fisici dovrà fornire un
servizio di alta qualità, al livello di un centro di calcolo attuale, i calcolatori utilizzati
saranno quelli professionali, escludendo per lo più i calcolatori personali, anche se in certi casi
il modello potrebbe essere esteso anche a loro (tramite reti peer to peer).

Per far questo, c’è bisogno di una rete di comunicazione molto sicura, ad alte prestazioni e di
costo accessibile. Si tratterà per lo più di connessioni di Internet ma su reti dedicate, le
cosiddette Intranet. Per usi meno critici si potrà anche fare uso della Internet che tutti usiamo
quotidianamente. Il primo passo è stato la creazione di una serie di programmi intelligenti, capaci
di verificare con grande sicurezza l’identità dell’utente, capire le risorse di calcolo di cui ha
bisogno (tipo di computer e sistema operativo, librerie, compilatori, locazione dei dati in ingresso
e destinazione dei dati in uscita etc.) ed infine valutarne il costo e verificare conseguentemente
il credito dell’utente.

Tutti questi controlli, con la cosequente allocazione di risorse, andranno fatti tenendo conto tutta
una serie di criteri anche finanziari. Si potrà per esempio offrire differenti livelli di qualità di
servizio a costi sempre più elevati. E si dovranno prendere decisioni non necessariamente ovvie. In
alcuni casi sarà infatti preferibile accedere a risorse di calcole estremamente remote, per magari
sfruttare la disponibilità di tempo macchina all’altro lato della terra, a costi di comunicazione
più ridotti. Altrimenti, si dovrà cercare di limitare l’accesso alla rete e cercare i dati o le
risorse di calcolo più vicine all’utente.

Ci sono già dei programmi che hanno permesso una prima implementazione di Grid sperimentali. Primo
fra tutti il sistema Globus, ma anche sistemi come Legion e Corba. Questi sistemi offrono una serie
di strumenti che si possono utilizzare per l’autentificazione degli utenti ed una prima allocazione
delle risorse.

www.globus.org

grid.cs.binghamton.edu/projects/legioncca.html

www.corba.org

Su questo si posso sviluppare dei sistemi più complessi che permettano la suddivisione del problema
in molti parti indipendenti da distribuire in maniera capillare sulla Grid a disposizione. In
pratica, un fisico potrà dal suo computer in ufficio o magari seduto in una sala di aspetto di un
qualunque aeroporto del mondo connettersi alla Grid con il suo navigatore preferito e accedere ad un
portale dedicato che gli fornirà tutte le istruzioni necessarie per descrivere il suo problema. A
questo punto, con un semplice click del suo mouse, potrà inviare in esecuzione il programma
corrispondente ed attendere i risultati che gli saranno inviati mentre magari sta volando alla sua
destinazione d’arrivo.

Una volta nel suo ufficio potrà accedere di nuovo alla Grid per esaminare i risultati ricevuti nel
frattempo e risottomettere una richiesta di calcolo se necessario. In ogni momento potrà interrogare
la Grid per sapere come sta procedendo la sua elaborazione ed avere una stima del costo finale.
Questo perché naturalmente la Grid non sarà gratuita né significherà la scomparsa dei grandi centri
di calcolo, ma semplicemente ne permetterà un uso integrato e più razionale permettendo di
raggiungere potenze di calcolo inimmaginabili fino ad oggi.

DATA GRID

Per progredire su questa strada, gli esperti informatici del CERN, in collaborazioni con i fisici
responsabili della nuova generazione di esperimenti per l’LHC, si sono associati con scienziati di
altre discipline come lo spazio e l’osservazione della terra (European Space Agency), la biologia
(CNRS in Francia e KNMI in Olanda), industrie informatiche interessate a questa nuova tecnologia
(IBM, CS-SI, Datamat) ed hanno proposto un progetto alla Commissione Europea, chiamato DataGrid (
www.eu-datagrid.org ).

Questo progetto è stato accettato con entusiasmo dalla Commissione ed ha cominciato ad operare con
un finanziamento di circa 10 milioni di euro per tre anni. Dopo solo nove mesi è stata attivata una
prima Grid sperimentale tra il CERN di Ginevra e il laboratorio IN2P3 di Lione in Francia.

GRID PHYSICS NETWORK

“In un futuro non molto lontano la Grid permetterà agli utenti di tutto il mondo di collaborare ed
utilizzare tutte le risorse di calcolo disponibili, pur essendo queste geograficamente distribuite
sul pianeta. Possiamo considerare la Grid un po’ come una super-Internet dove condivideremo molto
più di semplici informazioni”.

A parlare è Manuela Campanelli, responsabile della componente “Education and Outrech” del progetto
di ricerca denominato GriPhynN (Grid Physics Network). Missione del progetto è la costruzione di una
griglia computazionale mondiale in grado di esaminare l’enorme quantità di dati scientifici,
provenienti da esperimenti nel campo della fisica, biologia, genetica, ingegneria e astronomia.

Una nuova forma di condivisione delle risorse in rete sostituirà quindi quella cui siamo abituati e
decreterà molto probabilmente anche la fine dell’era del gratuito e l’inizio dell’epoca dei servizi
a pagamento e degli abbonamenti. Il Grid si preannuncia come il futuro “tecnocratico” della Rete,
disponibile solo all’uso di chi potrà “pagare il biglietto”, e in generale solo a chi possiederà la
necessaria conoscenza.

Non è d’accordo Fabrizio Gagliardi, direttore della School of Computing del CERN di Ginevra, secondo
cui: “Esistono ed esisteranno molte Grid, fino ad un punto in cui riusciremo a far convergere tutto
in una grande Grid comune che potrà servire anche ad annullare il divario elettronico tra il Terzo
Mondo e i paesi più industrializzati. Ad esempio, in Brasile, dove il Web è molto diffuso ma mancano
le risorse economiche, la Grid permetterà uno sviluppo tecnologico a prezzi politici. Ciò significa
che i ricercatori dei paesi disagiati non dovranno più abbandonare il loro paese, privando le
nazioni povere di risorse intellettuali importanti”.

SPACE GRID

La Grid dell’Agenzia Spaziale Europea raccoglie le informazioni di tutti i satelliti che inviano
continuamente dati dal nostro sistema planetario – in particolare, quello terrestre -, 24 ore su 24,
365 giorni all’anno. Questi dati vengono utilizzati per vari scopi, quali le telecomunicazioni, i
sistemi di navigazione e il controllo dell’ambiente (e, diciamolo pure, lo spionaggio).

La SpaceGRID è gestita da un consorzio internazionale di industrie e centri di ricerca guidati da
Datamat (Italia) con la partecipazione di Alcatel Space (Francia), CS Systèmes d’Information
(France), SSL Science Systems Plc (Regno Unito), QinetiQ (Regno Unito)e RAL (Regno Unito).

www.spacegrid.org

LARGE HADRON COLLIDER COMPUTING GRID

Nel corso di questa settimana, alcuni fisici inglesi daranno una prima dimostrazione della potenza
dell’ LCG (Large Hadron Collider Computing Grid), facendo lavorare 6.000 computers collegati da 70
siti internazionali. Entro il 2007, questa Grid possiederà la capacità di 100.000 supercomputer
attuali, generando un “cervellone virtuale” di enormi potenzialità, da cui ci si aspetta molto.

Innanzitutto, la scoperta di nuovi processi fisici, cruciali nella formazione dell’Universo, al
momento ancora sconosciuti (come la cosiddetta “materia oscura”). C’è chi parla già di “economia
sintetica”, chi si pensa cioè ad usare la Grid per predire i futuri trends commerciali analizzando i
comportamenti di milioni di consumatori in risposta a determinate campagne pubblicitarie.

Si useranno delle simulazioni, degli “ambienti sintetici” molto sofisticati, grazie
all’accrescimento della potenza di elaborazione delle informazioni, per testare nel mondo virtuale,
ciò che poi verrà introdotto nel mondo reale.

La Grid verrà ovviamente usata anche in tutte le supercomplesse analisi post-genomiche, alla ricerca
di nuovi farmaci, nuove cure e nuove “illuminazioni”. Gli esperti inglesi hanno anche creato una
mappa virtuale, consultabile on-line, per vedere la Grid all’opera, in tempo reale.

www.gridpp.ac.uk

Alessio Mannucci
E-mail: hugofolk@ecplanet.com

Condividi:

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *