250 likes | 368 Views
Supertietokoneet. Käsiteltävät aiheet:. Yleistä supertietokoneista Historia Tekniikka IBM Blue Gene/L Historia Teknologia Tavoitteet Speksit Verkot Sovellukset Playstation 3 ASC: Dedication video Kysymyksiä?. Supertietokoneet. Laskentateho TFlop/s luokkaa Valmistajia
E N D
Käsiteltävät aiheet: • Yleistä supertietokoneista • Historia • Tekniikka • IBM Blue Gene/L • Historia • Teknologia • Tavoitteet • Speksit • Verkot • Sovellukset • Playstation 3 • ASC: Dedication video • Kysymyksiä?
Supertietokoneet • Laskentateho TFlop/s luokkaa • Valmistajia • IBM: DeepBlue, BlueGene/L • Cray: XT3 • NEC: EarthSimulator IBM 360 v.1962
Historia • Määritelmä: Supertietokone on tietokone, joka kuuluu maailman 500 nopeimman tietokoneen joukkoon • Supertietokoneiden aikakausi alkoi 60-luvulla • Seymour Gray kehitti monia supertietokoneita • Japanilaiset ja yhdysvaltalaiset suurimpia rakentajia • Blue Gene /L tämän päivän nopein supertietokone
Prosessi • Prosessi on suorituksessa oleva ohjelma • Prosessit voivat yhtä aikaa suorittaa samaa ohjelmakoodia • Tilat: Ready, Wait ja Run (+ lisätilat)
Säikeet • Prosesseista kevyempiä versioita • Saman prosessin eri säikeillä yhteinen osoiteavaruus • Säikeet jakavat prosessin resurssit • Prosessi koostuu yhdestä tai useammasta säikeestä
Skedulointi (aikataulutus) • Tarkoitetaan menetelmää, jolla valitaan seuraavaksi suoritettava prosessi (tai säie tai työ) • Tavoitteena suorituskyvyn optimointi • FIFO, Kiinteä prioriteetti, vaihteleva prioriteetti, kiertovuorottelu (round robin)… • Käytännössä menetelmät yhdistelmiä edellä olevista menetelmistä
Muistinhallinta • Ohjelmaa kirjoittaessa sen sijaintia muistissa ei vielä tiedetä • Prosesseja voidaan myös suorituksen aikana siirtää muistialueelta toiselle • Laitteiston (MMU) vastuulla on huolehtia siitä, että prosessit eivät sotke toisiaan
Virtuaalimuisti • Muistiavaruus voi olla suurempi kuin todellisen muistin määrä • Osa keskusmuistista esim. kiintolevyllä, jolloin virtuaalimuisti suoritettaville prosesseille ”näkymätöntä” • Käyttöjärjestelmän vastuulla on hakea tarvittava muistialue levyltä
Segmentointi • Segmentillä tarkoitetaan yhtenäiselle muistialueelle talletettua yhteenkuuluvien tietojen joukkoa • Hyvä suojauksen yksikkö • Osoiteavaruuden osoite koostuu kahdesta eri komponentista • Segmentin tunnus • Siirtymä segmentin sisällä
Sivutus • Prosessin osoiteavaruus jaetaan vakiomittaisiin sivuihin • Osoite koostuu nyt sivunumerosta ja siirtymästä sivun sisällä • Sisäistä pirstoutumista
Von Neumann -arkkitehtuuri • Määrittelee tietokoneen rakennustavan • Osat • Kontrolliyksikkö - suorittaa yksinkertaisimmat käskyt • Aritmeettislooginen yksikkö - sisältää mm. yhteenlaskuissa ja loogisissa operaatioissa tarvittavien toimintojen toteutukset • Rekisterit - nopeaa muistia • Musti ja I/O-laitteet - kattavat koneen I/O- ja muistiavaruuden
Flynnin luokitus • Muuttujat syöte (käsky) ja data • SISD (Single Instruction Single Data) • SIMD (Single Instruction, Multiple Data) • MISD (Multiple Instruction Single Data) • MIMD (Multiple Instruction Multiple Data)
Supertietokonearkkitehtuurit • SIMD-järjestelmissä on käytössä tuhansia prosessoriyksiköitä • Vektoriprosessorit • MIMD-järjestelmissä prosessorimäärät voivat vaihdella muutamasta tuhanteen • Klusterit • Esim. System X
Blue Gene/L historiaa • Vuonna 1999 IBM julkisti $100 miljoonan U.S. budjetin tutkimusprojektin. • 2001 Lawrence Livermore National Laboratory (LLNL) liittyi mukaan projektiin. • Tavoitteet: • Viedä tietokoneiden suunnittelu ja ohjelmistot uudelle tasolle • Edistää biomolekyyli simulaatiota • Saavutti TOP500.org sivuston 1. sijan joulukuussa 2004
Teknologia: tavoitteet • Skaalautuvuus yhdestä aina useisiin kymmeniin räkkeihin • Kustannustehokkuus: • Virrankulutus / TFlop/s • Toimitila m2 / TFlop/s • Pakkaus: ASIC SoC • Tehokkuus / Peak • Soveltuvuus • ”Alhainen” hinta
Speksit • BG/L muodostuu 64x32x32 eli 216 = 65536 yksiköstä • 2*PowerPC 440 700MHz 32-bit prosessoria, 25W / yksikkö • Prosessorit ja muistit lähellä toisiaan nopeudessa • Molemmat voivat suorittaa neljä liukulukulaskua • Teho räkkiä kohden 2prosessoriax4liukulukuax700MHzkellotaajuusx1024yksikköä = 5.6TFlop/s • Koko järjestelmän teho n. 367 TFlop/s (Linpack: 280 TFlop/s) • 512-1024MB DDR / yksikkö, riippuen mallista
Virtual Node: Molemmilla prosessoreilla oma kernel Kaksinkertainen laskentateho... ...teoriassa, mutta seuraavat jaettu: Muisti ja väylä Verkkoresurssit L3 välimuisti jaettu CPU tekee laskennan & kommunikoinnin Coprocessor: Cpu 0 suorittaa kommunikoinnin ja Cpu 1 laskennan Koko muisti käytössä Laskentatilat
Verkot: 3D-Torus • Pääasiallinen kommunikointiverkko • BG/L:n torus muodostuu koordinaatistossa (x+,y+,z+,x-,y-,z-) toisiinsa liitetyistä yksiköistä • Yksiköiden välinen kommunikointi nopeus 175MB/s (1.4Gb/s) suuntaansa • Suuntia 6 x sisään & 6 x ulos • Kaista verrannollinen linkkien määrään ja latenssi yksiköiden väliseen etäisyyteen • Valittavissa dynaaminen- tai deterministinen reititys
Sovellukset • Yksikössä suorituksessa Compute Node Kernel, joka tarjoaa kiinteän 512MB osoiteavaruuden, ei sivutusta • Sisällytetty POSIX liityntä ja normaalit I/O operaatiot suoritetaan järjestelmäkutsuilla • Käyttäjien yksiköt tarjoavat SLES 9.0 Linux KJ:n ohjelmien kääntämiseen, debuggaamiseen ja tuomiseen järjestelmään • BlueGene/L tukee IBM XL FORTRAN, C ja C++ kääntäjiä
Sovelluskohteet HPC:lle • Molekyyli dynamiikka • Proteiinien laskostuminen • Viihdeteollisuus: Pixar Studios • 1*1014 FLOPs/kuva,50 kuvaa/s, 90min elokuva ~ 2.7*1019 FLOPs • Noin 2000 1GFLOP/s suorittimella ~ 150pv • Myös lääketiede, kauppatieteet yms. • PiFast?
Haasteet • Ohjelmien rinnakkaisuus • Verkon täyden kaistan hyödyntäminen • Verkon viestienvälityksen tuomat haasteet, MPI (Message Passing Interface) • Kääntäjillä vaikeuksia double FPU:n kanssa (ohjelmoijan optimoitavissa...)
Tulevaisuuden näkymä: Playstation 3 • Jos PS3 olisi julkaistu vuonna 2001, se olisi päässyt kymmenen tehokkaimman supertietokoneen joukkoon • Cell BE moniydin prosessori • 1 pääprosessori • 7 (8) yhteisvaikutuksessa toimivaa laskentayksikköä • Ilmestynee näillä näkymin syksyllä…
Lawrence Livermore National Laboratory • Purple ja BlueGene/L • Aseiden kehitys ja 3d-simulointi supertietokoneilla • 10:23min