Koti Etukäteen ajattelu Voivatko vaihtoehtoiset arkkitehtuurit hallita supertietokonetta?

Voivatko vaihtoehtoiset arkkitehtuurit hallita supertietokonetta?

Video: Real Skifi - Skiing with Tractors (Lokakuu 2024)

Video: Real Skifi - Skiing with Tractors (Lokakuu 2024)
Anonim

Viime vuosina olemme nähneet mielenkiintoisia uusia lähestymistapoja korkean suorituskyvyn tietojenkäsittelyyn, erityisesti siirtyminen pois perinteisistä isoista prosessoreista ja kohti x86-suorittimien klustereita kiihdyttimillä tai yhteisprosessoreilla tietyntyyppisten laskelmien nopeuttamiseksi. Viime viikon Super Computing -esityksen jälkeen näimme, että Intel pyrkii integroimaan Xeon Phi -koprosessorin perinteiseen Xeon-palvelinprosessoriin ohjelmoinnin helpottamiseksi; Nvidia esittelee uuden version Tesla GPU -kiihdyttimestä; ja Micron tukee hyvin erilaista prosessoria entistä erikoistuneemmalle tietojenkäsittelylle. Ja kaikki tämä tapahtui aikana, jolloin kiihdyttimet ja kopioprosessorit tulevat hallitsemaan maailman nopeimpien tietokoneiden Top 500-luetteloa. Joidenkin asiantuntijoiden mielestä nykyiset vertailuarvot antavat näille prosessoreille liikaa painoarvoa.

Nvidia mainitsi menestyksensä Tesla-kiihdytyslevyillä, suurilla ryhmillä GPU: ita, jotka on kytketty pääprosessoreihin joko Intelistä tai AMD: stä. Tällaisia ​​siruja käytetään monissa erilaisissa järjestelmissä, mukaan lukien Titan-järjestelmä Oak Ridgen kansallisessa laboratoriossa ja uusi Piz Daint -järjestelmä Sveitsin kansallisessa supertietokoneiden laskentakeskuksessa. Vielä mielenkiintoisempaa, yrityksen mukaan Tesla-levyt ovat kaikkien maailman energiatehokkaimpien supertietokoneiden viimeisimmän Green 500 -luettelon kymmenen parhaan järjestelmän joukossa. Kaikissa näissä järjestelmissä käytetään myös Intel Xeonsia lukuun ottamatta AMD Opteron -pohjaista Titania, joka on maailman toiseksi nopein järjestelmä Top 500: ssa, mutta sijoittuu paljon alhaisemmalle Green 500 -luettelossa.

Lisäksi Nvidia ilmoitti tekevänsä kumppanuutta IBM: n kanssa Tesla-kiihdyttimien tarjoamiseksi IBM Power -arkkitehtuuriin perustuvissa järjestelmissä. IBM on jo kauan tunnustanut sarjan suorituskykyään, ja sen PowerG-prosessoreihin perustuva BlueGene / Q-järjestelmä ylläpitää muun muassa Sequoia-järjestelmää Lawrence Livermore National Laboratoryssa ja Mira-järjestelmää Argonne National Laboratoryssa. IBM: n ja Nvidian yhteistyön pitäisi johtaa tulevaisuuden mielenkiintoisiin järjestelmiin.

Näyttelyssä yritys ilmoitti Tesla K40: n, GPU-kiihdytyskorttinsa seuraavan sukupolven. Yhtiö kertoi tarjoavansa 1, 4 teraflipsin kaksinkertaisen tarkkuuden suorituskykyä, 12 Gt muistia (288 Gt / s kaistanleveys) ja GPU Boost -ominaisuuden, jonka avulla se voi toimia nopeammalla kellonopeudella joissakin tilanteissa. Tämä on päivitys nykyiseen Tesla K20 -sarjaan, käyttäen samaa GPU: n perussuunnittelua, joka on tuotettu 28 nm: n tekniikalla.

Muihin aloitteisiin sisältyy tapoja helpottaa GPU-ohjelmointia, mukaan lukien CUDA 6, joka tukee nyt yhtenäistä muistia, antaen kehittäjien lähestyä muistia yhtenä poolina, vaikka CPU ja GPU-muisti pysyisivät erillään. Yhtiö tukee myös OpenACC: tä, vakiokokoelmaa kääntäjädirektiivejä, jotka kertovat järjestelmälle, mitkä ohjelman osat (kirjoitetut C / C ++ ja Fortran) voidaan ladata CPU: lta kiihdyttimeen suorituskyvyn parantamiseksi.

Intelin lähestymistapa, jota se kutsuu MIC-arkkitehtuuriksi, on hyvin erilainen. Se yhdistää useita pieniä x86-ytimiä yhdeksi siruksi nimeltä Xeon Phi. Viime vuosien ajan Intel on maininnut tosiasian, että kaikki x86-mallit helpottavat ohjelmointia, vaikka on selvää, että kehittäjien on silti kohdistettava arkkitehtuuri suoraan. Xeon Phin nykyinen versio, nimeltään Knights Corner, on suunniteltu käytettäväksi kiihdyttimenä perinteisten Xeon E -palvelimien kanssa, ja sitä käyttävät useat huippusysteemit, mukaan lukien Kiinan Tianhe-2 (tällä hetkellä nopein järjestelmä).) ja Stampede-järjestelmän Advanced Computing Centerissä Texasin yliopistossa.

Intel esitteli näyttelyssä uuden version, jonka nimi on Knights Landing, joka toimii myös itsenäisenä keskusyksikkönä, joka sopii tavalliseen telinearkkitehtuuriin ja käyttää käyttöjärjestelmää suoraan ilman, että vaaditaan isäntäprosessoria (kuten Xeon E). Tämä voi olla varsin tärkeä laajennettaessa Xeon Phin vetovoimaa, etenkin työasemarkkinoilla. Tämän on jälleen suunniteltu helpottamaan ohjelmistokehittäjien näkemistä yhdestä keskusyksiköstä. Knights Landing on saatavana sekä itsenäisenä prosessorina että PCI Express -korttina, joka sopii olemassa oleviin järjestelmiin päivityksenä Knights Cornerista.

Myös Knights Landingiin liittyy muita merkittäviä muutoksia, mukaan lukien "lähes muistin" lisääminen tehokkaasti DRAM: iin, jota tarjotaan paketilla CPU: n kanssa ja joka voi siten tuottaa paljon suuremman kaistanleveyden kuin perinteinen DDR-muisti, jota rajoittaa nopeus. bussi. (Sekin nousee nopeammin, mutta ei läheskään yhtä paljon.) Tämä ei ole ensimmäinen askel tähän suuntaan; IBM on maininnut sulautettua DRAMia Power-arkkitehtuurissaan vuosien ajan, ja Intel itse asettaa sulautettu DRAM grafiikkaan Haswell Core -perheen Iris Pro -versioissa. Luulen kuitenkin, että näemme tulevina vuosina paljon enemmän pyrkimyksiä tähän suuntaan.

Samaan aikaan yksi mielenkiintoisimmista uusista lähestymistavoista on peräisin Micronilta, joka ilmoitti uuden kiihdyttimen nimeltä Automata Processor, joka on suunniteltu lähinnä käsittelemään monimutkaisia ​​jäsentämättömiä dataongelmia.

Micron kuvaili tämän tarjoavan kankaan, joka koostuu kymmenistä tuhansista miljooniin prosessointielementeistä, jotka on kytketty tiettyjen tehtävien ratkaisemiseksi. Yksi suurimmista DRAM- ja NAND-muistien valmistajista sanoo, että tämä käyttää muistipohjaista prosessointia monimutkaisten tietojenkäsittelyhaasteiden ratkaisemiseksi esimerkiksi verkon tietoturvan, bioinformatiikan, kuvankäsittelyn ja analytiikan aloilla. Micron jakaa aluksi automaattisen prosessorin PCI-Express -kortille saadakseen kehittäjät työskentelemään sen kanssa, mutta yritys aikoo myydä prosessoreita tavanomaisissa muistimoduuleissa, joita kutsutaan DIMM-moduuleiksi tai sulautettujen järjestelmien yksittäisinä siruina. Joillakin tavoin tämä kuulostaa samanlaiselta kuin kenttäohjelmoitavat porttiryhmät (FPGA), jotka on viritetty ratkaisemaan tietyt sovellukset, joihin sisältyy kuvioiden sovittaminen.

Yrityksen mukaan se kehittää yhteistyössä Georgia Techin, Missourin yliopiston ja Virginian yliopiston kanssa uusia sovelluksia automaateille. Vaikka yritys ei ole ilmoittanut päivämäärää lopputuotteille, ohjelmistokehityspaketti ja simulaatiotyökalut julkaistaan ​​ensi vuonna.

Automata kuulostaa käynnissä olevalta töiltä ja on todennäköisesti liian aikaista tietää, kuinka leveät sovellukset ovat, mutta se on mielenkiintoinen lähestymistapa.

Kaiken kaikkiaan näemme korkean suorituskyvyn tietojenkäsittelyn kehitystä. Ei liian monta vuotta sitten, nopeimmat tietokoneet olivat enimmäkseen vain valtavia määriä tavallisia palvelinprosessoreita. Itse asiassa IBM Blue Gene -järjestelmät ja Sparc-pohjaiset järjestelmät (kuten Japanin RIKEN Advanced Computational Science -instituutin K-tietokone, joka käyttää Fujitsu Sparc -prosessoreita) muodostavat edelleen suuren osan markkinoista, mukaan lukien viisi kymmenestä nopeimmasta. järjestelmiä maailmassa. Mutta viime vuosina vauhti on lisääntynyt kohti yhteisprosessoria, jolloin Teslaa ja viime aikoina Xeon Phi -kiihdyttimiä käyttävät järjestelmät muodostavat enemmän uudemmista järjestelmistä. Näiden järjestelmien parannusten, uusien kumppanuuksien, parempien ohjelmistojen ja joidenkin uusien lähestymistapojen myötä supertietokonemarkkinat voivat tulevaisuudessa olla hyvin erilaisia.

Voivatko vaihtoehtoiset arkkitehtuurit hallita supertietokonetta?