260 likes | 436 Views
Dai problemi scientifici alle architetture di calcolo ovvero come cucire con aghi e gomene. Vittorio Rosato Servizio di Calcolo e Modellistica ENEA Casaccia rosato@casaccia.enea.it. Giovedì della Cultura Scientifica, Casaccia 29.4.2004. Key-points.
E N D
Dai problemi scientifici alle architetture di calcolo ovvero come cucire con aghi e gomene Vittorio Rosato Servizio di Calcolo e Modellistica ENEA Casaccia rosato@casaccia.enea.it Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Key-points un legame stretto tra problemi e modelli di calcolo I modelli di calcolo determinano le architetture sulle quali hanno maggiori possibilità di essere eseguiti efficientemente le piattaforme di calcolo dovrebbero essere“”science-driven” Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Invece… 3. Le architetture di calcolo sono funzionalizzate per altre classi di applicazioni (grafica, multimedia, internet etc.) dunque…… 4. La computational science ha dovuto elaborare nuovi modelli operativi e/o a utilizzare enormi piattaforme di calcolo visto che non può guidare lo sviluppo delle architetture. Questa presentazione illustrera’ alcuni degli ambiti nei quali la presenza di questi problemi ha spinto l’ elaborazione di (nuovi) modelli operativi. Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Architettura Gedanken experiment Problema L’approccio computazionale è ormai considerato come “la ”terza via” dell’approccio conoscitivo alla realtà Modello Architetture: - seriali - parallele Predizione Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Data partitioning farming Principali architetture parallele Distributed memory Shared memory Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Problema Modello locali linearizzazione data partitioning modello sistolico comp1 com1 comp2 com2 globali (spettrali, n-corpi) data partitioning difficile modello sistolico complesso comp1 com1 comp2 com2 Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Data partitioning farming Principali architetture parallele Data partitioning (ripartizione dei dati tra i nodi di calcolo) Task partitioning (ripartizione del lavoro tra i nodi di calcolo) Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Facciamo un esempio: modelli di reti complesse Reti complesse: grandi sistemi di nodi e archi che descrivono interazioni funzionali tra oggetti (o entità astratte). • interattoma del lievito (N=103) • coautorship (N=104) • rete di routers di internet (N=104) • catena alimentare (N=103) • ………. • …….. • Ammasso globulare (N=106) Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Calcolo di proprietà locali Calcolo del coeff. di clustering di una rete • nodo della rete devo calcolare il numero di legami tra i suoi vicini e compararlo con il numero massimo di legami che essi potrebbero sviluppare C = 5/10 = 0.5 Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Come implemento il calcolo di questa proprietà ? Fornisco a tutti gli elementi di calcolo la struttura della rete (2) attribuisco il calcolo di c di un subset di nodi a ciascun elemento di calcolo. Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Calcolo di proprietà globali : dinamica di un ammasso globulare N=105 • Calcolo delle rij (n= 1010) • Calcolo delle forze 1/ rij • Integrazione eq. del moto per k= 104 volte Problemi: • enorme numero di ops • Struttura non omogenea • Bilanciamento carico Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Calcolo rij su ciascun proc. Somma delle forze su i …… Ridotto traffico sulla rete Buona scalabilità n<32 gruppi di dati sui processori Calcolo rij intra-gruppo Trasmissione dati inter-proc. Calcolo rij intra-gruppo …… Grande traffico sulla rete Buona scalabilità per n<16 Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Problemi computazionali complessi • astrofisica (mod. cosmologici, mod. stellari) • protein folding • modelli quantistici di nano-strutture • systems biology • analisi e controllo di sistemi complessi • real-time (analisi di immagine, compressione etc.) • Termofluidodinamica, chimica delle reazioni • Plasma physics Giovedì della Cultura Scientifica, Casaccia 29.4.2004
..purtroppo….. www.top500.org 87% 68% 58% 64% 74% www.nersc.gov Giovedì della Cultura Scientifica, Casaccia 29.4.2004
..le cause principali….. Inoltre le prestazioni di (1) bandwidth e di latenza delle reti (2) bandwidth di accesso alle memorie (3) taglia delle memorie interne (cache) non hanno mostrato, nel tempo, lo stesso andamento della legge di Moore, dunque le piattaforme di calcolo sono -”equilibrate” Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Il risultato di tutto questo é Source: The Divergence problem, H. Simon, Director NERSC, June 2003 Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Soluzioni della tecnologia corrente: Earth Simulator 5192 processors ~ 40 Tflops (Tflops= 103 Miliardi op/sec) http://www.es.jamstec.go.jp/esc/eng/ Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Wide-area computing farms (GRID) Una GRID è un insieme di piattaforme di calcolo distribuite su un’ampia regione che possono eseguire parti diverse dello stesso codice oppure ”repliche” dello stesso codice con dati diversi. Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Applicazioni scientifiche su GRID ”globali” www.seti@home.org www.intel.com/cure/anthrax.htm folding.stanford.edu Giovedì della Cultura Scientifica, Casaccia 29.4.2004
HW dedicato Un’altra strategia consiste nella progettazione di architetture massimamente efficienti per lo svolgimento di specifiche tasks. Esempi: (1) GRAvitational PipE (GRAPE) per simulazioni astrofisiche Giovedì della Cultura Scientifica, Casaccia 29.4.2004
HW dedicato Giovedì della Cultura Scientifica, Casaccia 29.4.2004
HW dedicato Esempio: (2) APE per simulazioni di LQCD Giovedì della Cultura Scientifica, Casaccia 29.4.2004
HW dedicato Si possono progettare device HW (microprocessori) specializzati per effettuare in mainera molto efficiente (e dunque rapida) specifiche analisi su grandi quantità di sequenze (DNA, proteine). Su questa idea è in corso di realizzazione uno spin-off : Ylichron Automatic synthesis Automatic validation and check VHDL expression FPGA-based board (standard PCI) Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Conclusioni Il mercato ha selezionato le nuove architetture di calcolo. Tranne alcune eccezioni di piattaforme ”science driven” (IBM BlueGene, vector machines) la comunità scientifica userà, nei prossimi anni, sistemi MPP basati su componenti COTS . La GRID ha una duplice valenza: da un lato costituisce una soluzione sostenibile, dall’altro consente la realizzazione di progetti ad alto lavoro computazionale. Attribuiamo a questa strategia rilevanti implicazioni commerciali. I sistemi HW/SW possono costituire una soluzione conveniente in alcuni campi applicativi: la bioinformatica, le applicazioni real-time, l’analisi delle immagini etc. Il miglioramento della tecnologia delle logiche programmabili consentirà, a breve, di utilizzare questa soluzione anche per problemi di calcolo scientifico (floating-point). Giovedì della Cultura Scientifica, Casaccia 29.4.2004