Video: Rakennetaan TODELLA pieni tietokone PELIKONSOLIKSI! (Marraskuu 2024)
Eilinen uutinen siitä, että Kiinan Tianhe-2-supertietokone on nyt maailman nopein, ei ole kovinkaan järkyttävää. Aikaisempi versio oli loppujen lopuksi supertietokoneiden luettelon kärjessä jo vuonna 2010.
Hieman yllättävämpää on Tianhe-2: n (tunnetaan myös nimellä Linnunrata-2) takana oleva arkkitehtuuri. Se perustuu Intelin uuteen Xeon Phi -arkkitehtuuriin, joka yhdistää suuren määrän x86-ytimiä yhdeksi siruksi; supertietokone yhdistää sitten nämä sirut yhdeksi arkkitehtuuriksi. Tätä järjestelmää ei odoteta ottavan käyttöön vielä muutama vuosi, joten olin yllättynyt nähdessäni listan kärjessä Xeon Phi -pohjaisen järjestelmän. Mielenkiintoisimpana tässä on kilpailu järjestelmien kanssa, jotka perustuvat pääasiassa GPU-laskentaan. Nvidian CUDA GPU -ytimiin perustuva järjestelmä, joka viimeksi ylitti luettelon, on nyt toisella sijalla.
Top500-luettelo maailman nopeimmista tietokoneista ilmestyy tyypillisesti kahdesti vuodessa: kerran yhdessä Saksassa tapahtuvan kansainvälisen supertietokonferenssin (ISC) kanssa ja syksyllä taas supertietokonferenssin (SC 13) kanssa.
Tianhe-2, joka perustuu Changshassa, Kiinassa sijaitsevaan puolustustekniikan korkeakouluun, osoittaa jatkuvaa suorituskykyä yli 33, 8 petaflopsia (yli 17 500 biljoonaa liukulukulaskua sekunnissa) ja huipputehoa 54, 9 petaflopsia LINPACK-vertailukohdassa. Tämä tekee siitä noin kaksi kertaa nopeamman kuin edellinen johtaja, Titan-järjestelmä, joka perustuu Yhdysvaltain energiaministeriön Oak Ridge National Laboratoryan (ORNL). Tianhe-2: lla on 16 000 solmua, joissa molemmissa on kaksi Intel Xeon E5-2692 (12-ytimen prosessori, käyttäen Ivy Bridgeä) -prosessoria ja kolme Xeon Phi -prosessoria yhteensä 3 120 000 laskentaytimestä. Xeon-ytimet perustuvat tulevaan 12 ytimen Xeon # 5-2600 -sarjan versioon, joka perustuu 22 nm Ivy Bridge -arkkitehtuuriin. Kokonaisjärjestelmä kuluttaa 17, 8MW, mikä on suurin osa 500 parhaan listan parhaasta järjestelmästä, mutta koska suoritusarvot ovat niin korkeat, sitä pidetään silti suhteellisen energiatehokkaana. Kesäkuun luettelo tehokkaimmista supertietokoneista, Green500, julkaistaan lähiaikoina.
ORNL: n Titan-järjestelmä, joka ylitti edellisen luettelon, on nyt toisella sijalla. Tämä perustuu Cray XK7 -järjestelmään, jossa on 18 688 solmua, joista jokaisessa on 16-ytinen AMD Opteron 6274 ja Nvidia Tesla K20x -grafiikkakäsittely-yksikön (GPU) kiihdytin. Tämä järjestelmä osoittaa 17, 5 petaflopsin jatkuvaa suorituskykyä (yli 17 500 biljoonaa liukulukupisteoperaatiota sekunnissa) ja yli 27 petaflopsin huipputehoa LINPACK-vertailuarvossa. Sequoia-järjestelmä Lawrence Livermore National Laboratoryssa, joka perustuu IBM: n BlueGene / Q -järjestelmään ja sen Power CPU -laitteisiin, tuli toiseksi Top500-luettelossa vuosi sitten, mutta on pudonnut kolmanneksi. Neljännen sijan järjestelmä pysyy "K-tietokoneena" Japanin RIKEN Advanced Laskennallisen Tieteen Instituudissa, joka perustuu Fujitsu SPARC64 -prosessoreihin.
Neljä parasta järjestelmää esittävät neljä hyvin erilaista arkkitehtuuria. Perinteiset suuret rautajärjestelmät, kuten sellaiset, jotka perustuvat IBM: n BlueGene (Power) - ja Fujitsun SPARC-arkkitehtuureihin, ovat edelleen hyvin käynnissä, mutta suurin osa huomiosta kohdistuu Intelin uuteen Xeon Phi -arkkitehtuuriin ja Nvidian CUDA-arkkitehtuuriin. Samaan aikaan on edelleen tarinoita siitä, että Kiina pyrkii luomaan oman prosessorinsa supertietokonetta varten.
Yksityiskohtaisemmin Nvidia ilmoitti eilen, että Stanfordin yliopiston tutkijat käyttävät GPU: ita luodakseen maailman suurimman keinotekoisen hermoverkon, jonka tarkoituksena on mallintaa ihmisen aivojen oppimista. Se paljasti myös, että sen CUDA-työkalupakki tukee nyt ARM-pohjaisia alustoja.
Osana supertietokonferenssia Intel esitteli myös uusia versioita Xeon Phi-kopioprosessoriperheestään, mukaan lukien 7100, jossa on 61 ydintä, joiden kellotaajuus on 1, 23 GHz, 16 Gt: n muistikapasiteetin tuki ja yli 1, 2TFlops kaksinkertaisen tarkkuuden; Xeon Phi 3100 -tuoteperhe, jossa on 57 ydintä, joiden kellonaika on 1, 1 GHz, ja 1TFlops, joilla on kaksinkertainen tarkkuus; ja uusi 5100D, joka on suunniteltu siten, että pistorasiat voivat kiinnittyä minilevyyn käytettäväksi terän muodossa. Intel sanoo, että seuraava sukupolvi, joka tunnetaan nimellä "Knights Landing" ja perustuu tulevaan 14 nanometrin prosessitekniikkaan, toimii paitsi yhteisprosessorina myös pääprosessorina, poistaen siten monimutkaisuuden siirtää tietoja eri muistiryhmiin. Tämä integroi pakettimuistin suorituskyvyn nopeuttamiseksi.
Intel kutsuu perinteisten Xeon- ja Xeon Phi -prosessorien yhdistelmää "uusheterogeeniseksi arkkitehtuuriksi". Laitteistoarkkitehtuurilla on useita luokkia laskentamahdollisuuksia, joihin päästään yhdellä ohjelmointimallilla. Yhtiö korostaa, että koska kaikki x86, se voi virtaviivaistaa kehitystä ja optimointia tavoilla, jotka olisivat vaikeampia käytettäessä CPU: n ja GPU-kiihdyttimen yhdistelmää. Nvidia ja muut GPU-laskentaa ajavat yritykset olisivat eri mieltä tästä arviosta.
Intel puhui myös korkean suorituskyvyn tietojenkäsittelyn käytöstä paitsi perinteisiin käyttötarkoituksiin, kuten julkiseen ja sotilaalliseen tutkimukseen, ja huippuluokan kaupallisiin sovelluksiin, kuten öljyn ja kaasun simulointiin, mutta myös sovelluksiin, kuten iso data. Tavoitteena on tehdä supertietokoneista valtavirtaisempi.
Katso koko Top500-supertietokoneiden luettelo täältä.