1 / 25

Supertietokoneet

Supertietokoneet. Käsiteltävät aiheet:. Yleistä supertietokoneista Historia Tekniikka IBM Blue Gene/L Historia Teknologia Tavoitteet Speksit Verkot Sovellukset Playstation 3 ASC: Dedication video Kysymyksiä?. Supertietokoneet. Laskentateho TFlop/s luokkaa Valmistajia

Download Presentation

Supertietokoneet

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Supertietokoneet

  2. Käsiteltävät aiheet: • Yleistä supertietokoneista • Historia • Tekniikka • IBM Blue Gene/L • Historia • Teknologia • Tavoitteet • Speksit • Verkot • Sovellukset • Playstation 3 • ASC: Dedication video • Kysymyksiä?

  3. Supertietokoneet • Laskentateho TFlop/s luokkaa • Valmistajia • IBM: DeepBlue, BlueGene/L • Cray: XT3 • NEC: EarthSimulator IBM 360 v.1962

  4. Historia • Määritelmä: Supertietokone on tietokone, joka kuuluu maailman 500 nopeimman tietokoneen joukkoon • Supertietokoneiden aikakausi alkoi 60-luvulla • Seymour Gray kehitti monia supertietokoneita • Japanilaiset ja yhdysvaltalaiset suurimpia rakentajia • Blue Gene /L tämän päivän nopein supertietokone

  5. Prosessi • Prosessi on suorituksessa oleva ohjelma • Prosessit voivat yhtä aikaa suorittaa samaa ohjelmakoodia • Tilat: Ready, Wait ja Run (+ lisätilat)

  6. Säikeet • Prosesseista kevyempiä versioita • Saman prosessin eri säikeillä yhteinen osoiteavaruus • Säikeet jakavat prosessin resurssit • Prosessi koostuu yhdestä tai useammasta säikeestä

  7. Skedulointi (aikataulutus) • Tarkoitetaan menetelmää, jolla valitaan seuraavaksi suoritettava prosessi (tai säie tai työ) • Tavoitteena suorituskyvyn optimointi • FIFO, Kiinteä prioriteetti, vaihteleva prioriteetti, kiertovuorottelu (round robin)… • Käytännössä menetelmät yhdistelmiä edellä olevista menetelmistä

  8. Muistinhallinta • Ohjelmaa kirjoittaessa sen sijaintia muistissa ei vielä tiedetä • Prosesseja voidaan myös suorituksen aikana siirtää muistialueelta toiselle • Laitteiston (MMU) vastuulla on huolehtia siitä, että prosessit eivät sotke toisiaan

  9. Virtuaalimuisti • Muistiavaruus voi olla suurempi kuin todellisen muistin määrä • Osa keskusmuistista esim. kiintolevyllä, jolloin virtuaalimuisti suoritettaville prosesseille ”näkymätöntä” • Käyttöjärjestelmän vastuulla on hakea tarvittava muistialue levyltä

  10. Segmentointi • Segmentillä tarkoitetaan yhtenäiselle muistialueelle talletettua yhteenkuuluvien tietojen joukkoa • Hyvä suojauksen yksikkö • Osoiteavaruuden osoite koostuu kahdesta eri komponentista • Segmentin tunnus • Siirtymä segmentin sisällä

  11. Sivutus • Prosessin osoiteavaruus jaetaan vakiomittaisiin sivuihin • Osoite koostuu nyt sivunumerosta ja siirtymästä sivun sisällä • Sisäistä pirstoutumista

  12. Von Neumann -arkkitehtuuri • Määrittelee tietokoneen rakennustavan • Osat • Kontrolliyksikkö - suorittaa yksinkertaisimmat käskyt • Aritmeettislooginen yksikkö - sisältää mm. yhteenlaskuissa ja loogisissa operaatioissa tarvittavien toimintojen toteutukset • Rekisterit - nopeaa muistia • Musti ja I/O-laitteet - kattavat koneen I/O- ja muistiavaruuden

  13. Flynnin luokitus • Muuttujat syöte (käsky) ja data • SISD (Single Instruction Single Data) • SIMD (Single Instruction, Multiple Data) • MISD (Multiple Instruction Single Data) • MIMD (Multiple Instruction Multiple Data)

  14. Supertietokonearkkitehtuurit • SIMD-järjestelmissä on käytössä tuhansia prosessoriyksiköitä • Vektoriprosessorit • MIMD-järjestelmissä prosessorimäärät voivat vaihdella muutamasta tuhanteen • Klusterit • Esim. System X

  15. Blue Gene/L historiaa • Vuonna 1999 IBM julkisti $100 miljoonan U.S. budjetin tutkimusprojektin. • 2001 Lawrence Livermore National Laboratory (LLNL) liittyi mukaan projektiin. • Tavoitteet: • Viedä tietokoneiden suunnittelu ja ohjelmistot uudelle tasolle • Edistää biomolekyyli simulaatiota • Saavutti TOP500.org sivuston 1. sijan joulukuussa 2004

  16. Teknologia: tavoitteet • Skaalautuvuus yhdestä aina useisiin kymmeniin räkkeihin • Kustannustehokkuus: • Virrankulutus / TFlop/s • Toimitila m2 / TFlop/s • Pakkaus: ASIC SoC • Tehokkuus / Peak • Soveltuvuus • ”Alhainen” hinta

  17. Speksit • BG/L muodostuu 64x32x32 eli 216 = 65536 yksiköstä • 2*PowerPC 440 700MHz 32-bit prosessoria, 25W / yksikkö • Prosessorit ja muistit lähellä toisiaan nopeudessa • Molemmat voivat suorittaa neljä liukulukulaskua • Teho räkkiä kohden 2prosessoriax4liukulukuax700MHzkellotaajuusx1024yksikköä = 5.6TFlop/s • Koko järjestelmän teho n. 367 TFlop/s (Linpack: 280 TFlop/s) • 512-1024MB DDR / yksikkö, riippuen mallista

  18. Virtual Node: Molemmilla prosessoreilla oma kernel Kaksinkertainen laskentateho... ...teoriassa, mutta seuraavat jaettu: Muisti ja väylä Verkkoresurssit L3 välimuisti jaettu CPU tekee laskennan & kommunikoinnin Coprocessor: Cpu 0 suorittaa kommunikoinnin ja Cpu 1 laskennan Koko muisti käytössä Laskentatilat

  19. Verkot: 3D-Torus • Pääasiallinen kommunikointiverkko • BG/L:n torus muodostuu koordinaatistossa (x+,y+,z+,x-,y-,z-) toisiinsa liitetyistä yksiköistä • Yksiköiden välinen kommunikointi nopeus 175MB/s (1.4Gb/s) suuntaansa • Suuntia 6 x sisään & 6 x ulos • Kaista verrannollinen linkkien määrään ja latenssi yksiköiden väliseen etäisyyteen • Valittavissa dynaaminen- tai deterministinen reititys

  20. Sovellukset • Yksikössä suorituksessa Compute Node Kernel, joka tarjoaa kiinteän 512MB osoiteavaruuden, ei sivutusta • Sisällytetty POSIX liityntä ja normaalit I/O operaatiot suoritetaan järjestelmäkutsuilla • Käyttäjien yksiköt tarjoavat SLES 9.0 Linux KJ:n ohjelmien kääntämiseen, debuggaamiseen ja tuomiseen järjestelmään • BlueGene/L tukee IBM XL FORTRAN, C ja C++ kääntäjiä

  21. Sovelluskohteet HPC:lle • Molekyyli dynamiikka • Proteiinien laskostuminen • Viihdeteollisuus: Pixar Studios • 1*1014 FLOPs/kuva,50 kuvaa/s, 90min elokuva ~ 2.7*1019 FLOPs • Noin 2000 1GFLOP/s suorittimella ~ 150pv • Myös lääketiede, kauppatieteet yms. • PiFast?

  22. Haasteet • Ohjelmien rinnakkaisuus • Verkon täyden kaistan hyödyntäminen • Verkon viestienvälityksen tuomat haasteet, MPI (Message Passing Interface) • Kääntäjillä vaikeuksia double FPU:n kanssa (ohjelmoijan optimoitavissa...)

  23. Tulevaisuuden näkymä: Playstation 3 • Jos PS3 olisi julkaistu vuonna 2001, se olisi päässyt kymmenen tehokkaimman supertietokoneen joukkoon • Cell BE moniydin prosessori • 1 pääprosessori • 7 (8) yhteisvaikutuksessa toimivaa laskentayksikköä • Ilmestynee näillä näkymin syksyllä…

  24. Lawrence Livermore National Laboratory • Purple ja BlueGene/L • Aseiden kehitys ja 3d-simulointi supertietokoneilla • 10:23min

More Related