Koti Etukäteen ajattelu Supertietokone 15: suurempia muutoksia horisontissa

Supertietokone 15: suurempia muutoksia horisontissa

2024

Video: Kasasimme 10000€ tietokoneen! (Marraskuu 2024)

Kun tarkastelen Austinissa viime kuussa pidetyn Supercomputing 15 (SC15) -konferenssin ilmoituksia ja tapahtumia, näyttää siltä, että vaikka suorituskykyinen tietojenkäsittely saattaa olla hiukan hiljaista, se on markkinat, joille on suunnattu joitain suuria muutoksia vuodessa tulla.

Jos tarkastellaan top500-luettelon johtajia, joka on maailman nopeimpien tietokoneiden luettelo kahdesti vuodessa, johtaja on kuudennen peräkkäisen kerran Tianhe-2, Kiinan puolustustekniikan kansallisen yliopiston rakentama supertietokone. Top500-luettelon mukaan tämä kone tuottaa 33, 86 petaflop / s (kvadriljoonia laskelmia sekunnissa) jatkuvaa suorituskykyä Linpack-vertailuarvossa ja 54, 9 petaflop / s teoreettista huipputehoa. Tämä perustuu Intel Xeon- ja Xeon Phi -prosessoreihin.

Toinen sija menee edelleen Titanille, Cray XK7 -järjestelmälle, joka perustuu AMD Opteron -suorittimiin ja Nvidia K20x GPU -sovelluksiin, jotka on asennettu DOE: n Oak Ridgen kansallisessa laboratoriossa, nopeudella 17.59 petaflop / s Linpack-vertailukohdassa.

Kaksi uutta konetta murtui kymmenen parhaan joukon. Trinity-tietokone Lawrence Livermore National Laboratoryssa (LLNL) on kuudes (8, 1 petaflop / s), kun taas Hazel-Hen-järjestelmä Saksan Höchstleistungsrechenzentrum Stuttgartissa (HLRS) tuli kahdeksanneksi 5, 6 petaflop / s: lla. Molemmat ovat Cray XC -koneita, jotka perustuvat Intel Xeon -prosessoreihin, joissa Oinas ovat yhteydessä toisiinsa.

Suurempia muutoksia tapahtuu luettelossa, etenkin kun kiinalaisten järjestelmien lukumäärä kasvoi suuresti ja kasvoi 109: een, kun se oli vain 37 edellisessä luettelossa. Osittain tämä näyttää johtuvan useammasta kiinalaisesta järjestelmästä, joka käyttää vertailuarvoja ja toimittaa tuloksia luettelolle. Seurauksena oli, että Yhdysvaltojen järjestelmien lukumäärä laski 231: stä 200: een, mikä on pienin luku luettelon perustamisen jälkeen vuonna 1993; ja eurooppalaisten järjestelmien lukumäärä laski 141: stä 108: een.

Yksi iso suuntaus on kiihdyttimiä tai kopioprosessoreja käyttävien järjestelmien lukumäärän kasvu, joka nousi nykyisen luettelon 104 järjestelmään heinäkuun 90: stä. Suurin osa näistä järjestelmistä käyttää Nvidia Tesla GPU -sovelluksia, joita seuraavat Intelin Xeon Phi -yhteisprosessorit, muutama käyttää yhdistelmää. Nvidia huomautti, että se oli 70 näistä järjestelmistä, mukaan lukien 23 luettelon 24 uudesta järjestelmästä.

Nvidia korosti näyttelyssä kiihdyttimien kasvua ja etenkin niiden sovellusten määrää, jotka ovat nyt saatavana optimoituna yrityksen CUDA-arkkitehtuuriin. Yrityksen mukaan 90 prosenttia kymmenestä parhaan suorituskyvyn laskentasovelluksesta ja 70 prosenttia 50 parhaasta on nyt nopeutettu. Yksi kiehtova käyttö on järjestelmiin, joissa suoritetaan sääsimulaatioita, mikä on tärkeä sovellus korkean suorituskyvyn laskentaan, koska kaikenlaiset hallitukset tuottavat sääennusteita. Cray oli aiemmin viitannut tällaisten kiihdyttimien käyttöön Sveitsin meteorologian virastossa (MeteoSwiss) ja on puhunut siitä, miten se toimii Sveitsin tutkijoiden kanssa monien sovellusten uudelleenkirjoittamisessa. Nvidia viittaa nyt kiihdyttimiin, joita National Oceanic and Atmospheric Administration (NOAA) käyttää myös joihinkin sääennusteisiinsa.

Cray sisältää muun muassa öljy- ja kaasusovelluksia, joita käytetään esimerkiksi 3D-geofysiikan avulla simuloitaessa säiliötä, sekä rahoituspalveluita, kuten riskien arviointia. Tällaiset sovellukset muodostavat harvoin maailman nopeimpia järjestelmiä, mutta ovat osoitus siitä, että korkean suorituskyvyn tietojenkäsittelyllä on laajempi rooli entistä enemmän yrityssovelluksissa. Cray on puhunut tasaisesta etenemisestä suurempien ja yksityiskohtaisempien mallien käyttämiseen kaikilla tieteen ja tekniikan aloilla sekä perinteisten työtaakkojen yhdistämisestä analytiikkaan.

Olen myös kiinnostunut Linux-säätiön ilmoituksesta uudesta OpenHPC-työstä, jonka tarkoituksena on luoda avoimempia standardeja HPC-maailmaan. Se on mielenkiintoinen idea, ja jolla näyttää siltä, että monet suuret pelaajat kirjautuvat sisään.

Teoksissa on joukko uusia järjestelmiä. IBM rakentaa uutta Summit-nimistä konetta Oak Ridge National Laboratories (ORNL) ja toinen nimeltään Sierra Lawrence Livermore National Laboratoryssa (LLNL), jotka molemmat perustuvat IBM Power -arkkitehtuuriprosessorien, Nvidia Tesla GPU: n ja Mellanox -yhteyksiin. Huippukokouksen odotetaan tuottavan 150-300 huippunopeutta / s ja Sierran yli 100 petaflop / s.

Lisäksi Intel ja Cray rakentavat uutta Aurora-nimistä konetta, joka perustuu tuleviin Knights Hill Intel Xeon Phi -prosessoreihin Argonne Leadership Computing Facility -yritykselle (osa Argonne National Labs: ta) ja jonka tavoitteena on 150 petaflops vuonna 2018. Kaikki nämä ovat osa energiaosasto-ohjelmaa, joka tunnetaan nimellä Oak Ridgen, Argonnen ja Lawrence Livermoren kansalliset laboratoriot (CORAL), jonka tarkoituksena on nopeuttaa korkean suorituskyvyn tietojenkäsittelyn ja erityisesti FastForward 2 -hankkeen kehittämistä.

Silti meillä on vielä pitkä tie kuljettavana kohti "exascale computingia".

Sillä välin oli useita prosessori-ilmoituksia, jotka saattoivat hyvää tulevaisuuden kannalta. Erityisesti Nvidia painotti supertietokoneiden käyttöä hyperscale-verkkosovelluksissa, erityisesti koneoppimisessa. Se ilmoitti muutamasta jonkin verran huonomman asteen tuotteesta: Tesla M40 -levy, jossa on 3072 CUDA-ydintä, jonka mukaan se pystyi suorittamaan jopa seitsemän yhden tarkkuuden teraflop / s, joka on tarkoitettu ensisijaisesti "syvän oppimisen" harjoitukseen, ja M4, alempi tehokortti, jossa on 1024 ydintä ja 2, 2 yhden tarkkuuden terafloppia / s, jota voidaan käyttää syvän oppimisen päättämiseen samoin kuin esimerkiksi kuvan ja videon käsittelyyn. Lisäksi yhtiö julkisti uuden "hyperscale-sarjan" sovelluksineen, jotka on suunnattu suurimpiin laskentapaikkoihin. Molemmat uudet laitteistotuotteet perustuvat 28 nm prosessitekniikkaan ja yrityksen Maxwell-arkkitehtuuriin.

Yhtiö on ilmoittanut seuraavana vuonna toimittavansa kaksi jatkoarkkitehtuuria, tunnetaan nimellä Pascal, ja Voltaa, jotka seuraavat sitä. Intel keskittyi siihen, miten HPC vaikuttaa tieteeseen, ja minua kiinnosti sen kuvaus siitä, kuinka se käyttää omaa supertietokonetta - joka on tällä hetkellä 99 parhaan 500 luettelossa - auttaakseen suunnittelemaan omia prosessoreitaan. Erityisesti yrityksen mukaan se käyttää miljoona prosessorituntia vain suunnitellakseen valokuvien maskit seuraavan sukupolven prosessoreille.

Suuri osa Intelin toiminnasta keskittyi Knights Landingiin, joka on sen Xeon Phi -sirun seuraava versio, jota voidaan käyttää kiihdyttimenä, mutta myös käynnistää; ja sen Omni-Path-kangas. Vaikka Intel sanoo nyt yleisen saatavuuden olevan vuoden 2016 ensimmäisellä puoliskolla, muutamalla asiakkaalla on varhainen käyttöoikeus Knights Landingiin. Tällä hetkellä Cray testaa suurta Knights Landing -järjestelmää uuden Cori-nimisen supertietokoneen toimittamiseksi National Energy Research Scientific Computing Centerille (NERSC) ja Los Alamosin kansalliselle laboratoriolle ja Sandia National Laboratoriesille ensi vuonna. Bull, ranskalaisen Atos-järjestelmäintegraattorin yksikkö, on myös saanut Knights Landingin varhaiset versiot valmistautuakseen Tera 1000 -järjestelmään, jota se rakentaa Ranskan vaihtoehtoisten energialähteiden ja atomienergiakomissiolle. Argonne Leadership Computing Facility kehittää Theta-nimistä järjestelmää, jonka on määrä toimittaa ensi vuonna. Sandia National Laboratories työskentelee Penguin Computing -yrityksen kanssa päivittääkseen useita järjestelmiä, jotka käyttävät Xeon Phi -prosessorien aiempia sukupolvia.

Intel on aiemmin sanonut, että Knights Landingistä tulee olemaan kolme erilaista versiota: perustason isäntäprosessori (itse käynnistyvä), isäntäprosessori integroidulla Omni-Path-kankaalla ja PCIe-kiihdytinkortti. Itse siru koostuu 36 laatasta, joissa molemmissa on kaksi CPU-ydintä (yhteensä 72 ydintä), neljä vektoriprosessointiyksikköä (kaksi ydintä kohden), 1MB jaettua L2-välimuistia ja välimuistiaine yhtenäisyyden ylläpitämiseksi; ja Intel on sanonut, että sen pitäisi tarjota noin kolme kertaa Knights Corner -suorittimen skalaarisuorituskyky, 3 teraflop / s kaksinkertaisen tarkkuuden ja 6 teraflop / s yhden tarkkuuden huipputeho. Se käyttää myös uutta MCDRAM-nimistä muistijärjestelmää, joka on pakettimuisti, jolla on yli kolminkertainen käytettävissä oleva kaistaleveys verrattuna DDR4: lle, joka näyttää olevan vaihtoehto Hybrid Memory Cube -arkkitehtuurissa, jonka Intel ja Micron ovat puhuneet siitä. Näyttelyssä Crayllä oli prototyyppijärjestelmä, joka sisälsi käynnistyvän Knights Landingin, ja monet muut myyjät esittelivät Knights Landingille suunniteltuja järjestelmiä. Tätä Xeon Phi -versiota seuraa seuraavana versiona nimeltään Knights Hill, joka on tarkoitus rakentaa tulevalle 10nm: n prosessille.

Lisäksi Fujitsu puhui hiukan enemmän Flagship 2020 -projektistaan, joka perustuu uuteen siruun, joka tunnetaan FX100: na 32 ytimellä. Tämän odotetaan olevan noin nelinkertainen liukulukujen suorituskyvyn verrattuna nykyiseen FX10: ään, ja kuten Knights Landing, Fujitsun FX100 käyttää myös Hybrid Memory Cube -arkkitehtuurin versiota. Lisäksi NEC: llä on SX-ACE-sirun jatkotoimenpiteisiin perustuva projekti, koodinimeltään Aurora (ei liity CORAL-projektiin), mutta jolla on suurempi muistin kaistanleveys. Tämä on suunnattu vuodelle 2017.