Koti Etukäteen ajattelu Suurtietokoneet ovat viimein näkymässä horisontaalisesti

Suurtietokoneet ovat viimein näkymässä horisontaalisesti

2024

Video: Studia Generalia Miten pandemiat muuttavat maailmaa?: Kriisi, talous ja kulutus (Marraskuu 2024)

Kun katsotaan taaksepäin tämän viikon ISC 17 -supertietokonferenssiin, näyttää siltä, että supertietokonemaailmassa tapahtuu joitain suuria päivityksiä parin seuraavan vuoden aikana, mutta päivitys maailman nopeimpien supertietokoneiden Top 500 -luetteloon ei ollut kovin erilainen kuin edellinen versio.

Maailman nopeimpia tietokoneita ovat edelleen kaksi massiivista kiinalaista konetta, jotka ovat olleet listan kärjessä muutaman vuoden ajan: Sunway TaihuLight -tietokone Kiinan kansallisesta superlaskentakeskuksesta Wuxissa. Linpack-suorituskyky on yli 93 petaflopsia (93 tuhatta biljoonaa liukuluku). operaatiot sekunnissa); ja Tianhe-2 -tietokone Kiinan kansallisesta super-tietokonekeskuksesta Guangzhoussa, ja sen suorituskyky on yli 33, 8 petaflopsia. Nämä ovat edelleen nopeimpia koneita huomattavalla marginaalilla.

Uusi numero kolme on Piz Daint -järjestelmä Sveitsin kansalliselta superlaskentakeskukselta, Cray-järjestelmä, joka käyttää Inteliä Xeons ja Nvidia Tesla P100, joita äskettäin päivitettiin antamaan sille Linpackin kestävä suorituskyky 19, 6 petaflopsia, kaksinkertainen aikaisempaan kokonaismäärään verrattuna. Se siirsi sitä listan kahdeksasta.

Tämä pudottaa Yhdysvaltain huippujärjestelmän - Titan-järjestelmän Oak Ridgen kansallisessa laboratoriossa - neljännelle sijalle, jolloin tämä on ensimmäinen kerta kahdenkymmenen vuoden aikana, kun Yhdysvaltojen järjestelmää ei ole kolmen parhaan joukossa. Loput luettelosta pysyy muuttumattomana: Yhdysvaltojen osuus on edelleen viisi kymmenestä kymmenestä ja Japanin kahdesta.

Vaikka nopein tietokoneluettelo ei ole muuttunut paljon, muualla tapahtuu suuria muutoksia. Green 500 -luettelossa energiatehokkaimmista järjestelmistä yhdeksän kymmenestä muuttui. Päälle on sijoitettu Tsubame 3.0 -järjestelmä, modifioitu HPE ICE XA -järjestelmä Tokion teknillisessä instituutissa, joka perustuu Xeon E5-2680v4 14 -ytimeen, Omni-Path -yhteyteen ja Nvidian Tesla P100 -laitteeseen, joka mahdollistaa 14, 1 gigaflops / watt. Tämä on valtava hyppy Nvidian DGX Saturn V: ltä, joka perustuu yrityksen DGX-1-alustaan ja P100-siruihin, joka oli marraskuun ykkönen, mutta tällä kertaa kymmenen, nopeudella 9, 5 gigaflops / Watt. P100 on yhdeksässä kymmenestä Green500-järjestelmästä.

10 gigaflipsin / watin rikkominen on iso asia, koska se tarkoittaa, että nykypäivän tekniikalla rakennettu hypoteettinen exaflop-järjestelmä kuluttaisi alle 100 megawattia (MW). Se on vielä liikaa - tavoite on 20-30 MW exaflop-järjestelmälle, jonka tutkijat toivovat näkevän seuraavan viiden vuoden aikana - mutta se on valtava askel eteenpäin.

Kuten Top 500 -luettelossa, samankaltaisissa luetteloissa, joissa on erilaisia vertailuarvoja, tapahtui vain vähäisiä muutoksia, kuten High Performance Conjugate Gradients (HPCG) -vertailu, jossa koneet näkevät yleensä vain 1-10 prosenttia teoreettisesta huipputehokkuudestaan ja jossa huippuluokan huippu järjestelmä - tässä tapauksessa Riken K-kone - tuottaa silti vähemmän kuin yhden petaflopin. Sekä TaihuLight että Piz Daint -järjestelmät siirtyivät ylöspäin tässä luettelossa. Kun tutkijat puhuvat exaflop-koneesta, he yleensä tarkoittavat Linpack-vertailuarvoa, mutta HPCG voi olla realistisempi reaalimaailman suorituskyvyn kannalta.

GPU-tietojenkäsittelyn esiintyminen kiihdyttimenä - melkein aina Nvidia GPU-prosessoreita, kuten P100 - käyttämällä on ollut näkyvin muutos näissä luetteloissa viime vuosina, mitä seuraa Intelin oman kiihdyttimen, moniytimisen Xeon Phi (mukaan lukien viimeisin Knights Landing -versio). Nykyiseen Top 500 -luetteloon sisältyy 91 järjestelmää, jotka käyttävät kiihdyttimiä tai yhteisprosessoreita, mukaan lukien 74 Nvidia GPU: n kanssa ja 17 Xeon Phi: n kanssa (toisen kolmen käyttäessä molempia); yhdessä AMD Radeon GPU: n kanssa kiihdyttimenä ja kahdessa, joka käyttää japanilaisen toimittajan PEZY Computingin moniytimistä prosessoria. Ylimääräiset 13 järjestelmää käyttävät nyt Xeon Phiä (Knights Landing) pääkäsittelyyksikkönä.

Mutta monet supertietokoneiden suuremmista muutoksista ovat edelleen näkyvissä, kun alamme nähdä suurempia järjestelmiä, jotka on suunniteltu näiden käsitteiden mielessä. Yksi esimerkki on uusi MareNostrum 4 Barcelonan superlaskentakeskuksessa, joka pääsi 500 parhaan listan numeroon 13. Tähän mennessä asennettuna tämä on Lenovo-järjestelmä, joka perustuu Xeonin tulevaan Skylake-SP-versioon (virallisesti Xeon Platinum 8160 24 -prosessori). Mielenkiintoisia ovat seuraavat seuraavat pariksi vuodeksi suunnitellut kolme uutta "nousevan teknologian" klusteria, mukaan lukien yksi klusteri, jossa on IBM Power 9 -suorittimet ja Nvidia GPU: t, joiden suunniteltu huippukäsittelykyky on yli 1, 5 Petaflopsia; toinen perustuu Knights Hill -versioon Xeon Phista; ja kolmas perustuu Fujitsun suunnittelemiin 64-bittisiin ARMv8-prosessoreihin.

Näitä käsitteitä käytetään monissa muissa suurissa superlaskentaprojekteissa, erityisesti useissa Yhdysvaltain energiaministeriön sponsoroimissa CORAL-yhteistyössä Oak Ridgessä, Argonnessa ja Lawrence Livermore National Labsissa. Ensin tulisi olla huippukokous Oak Ridgessä, joka käyttää IBM Power 9 -prosessoreita ja Nvidia Volta GPU: ita ja jonka avulla toimitetaan yli 150–300 huippunopeutta; jota seurasi Sierra Lawrence Livermoressa, suunniteltu toimittamaan yli 100 huippunopeutta.

Sitten meidän pitäisi nähdä Aurora-supertietokone Argonnen kansallisessa laboratoriossa, joka perustuu Knights Hill -versioon Xeon Phista ja rakentaa Cray, joka on suunniteltu toimittamaan 180 huippunopeutta. CORAL-järjestelmien tulisi olla ylös ja juoksu ensi vuonna.

Samaan aikaan myös kiinalaiset ja japanilaiset ryhmät ovat suunnitelleet päivityksiä, useimmiten käyttämällä ainutlaatuisia arkkitehtuureja. Sen pitäisi olla mielenkiintoista katsella.

Vielä suurempi muutos näyttää olevan vain vähän kauempana: siirtyminen kohti koneoppimista, yleensä massiivisesti rinnakkaisissa prosessointiyksiköissä itse prosessorissa. Vaikka Linpack-luku viittaa 64-bittiseen tai kaksinkertaiseen tarkkuuteen, on olemassa sovellusluokkia - mukaan lukien monia syviä hermoverkkopohjaisia sovelluksia -, jotka toimivat paremmin yhden tai jopa puolitarkkailun laskelmissa. Uudet prosessorit hyödyntävät tätä, kuten Nvidian äskettäinen Volta V100 -ilmoitus ja tuleva Knights Mill -versio Xeon Phista. Näyttelyssä Intel kertoi, että versiossa, jonka on määrä valmistua viimeisellä vuosineljänneksellä, olisi uudet "pienitarkkaan tietojenkäsittelyyn" tarkoitetut ohjeet nimeltään Quad Fused Multiply Add (QFMA) ja Quad Virtual Neural Network Instruction (QVNNI)..

Oletan, että näitä käsitteitä voitaisiin soveltaa myös muihin arkkitehtuureihin, kuten Googlen TPU tai Intelin FPGA ja Nervana-sirut.

Vaikka emme näe suuria muutoksia tänä vuonna, ensi vuonna pitäisi odottaa lisää. Exascale-koneen (1000 teraflops) käsite on edelleen näkyvissä, vaikka siihen liittyy todennäköisesti useita vielä suurempia muutoksia.