Koti Etukäteen ajattelu Amd ja Intel avaavat grafiikan eteen prosessoritaistelussa

Amd ja Intel avaavat grafiikan eteen prosessoritaistelussa

Video: Почему AMD проиграла Intel в ноутбуках (Lokakuu 2024)

Video: Почему AMD проиграла Intel в ноутбуках (Lokakuu 2024)
Anonim

Viimeaikaisten ilmoitusten sarjassa Intel ja AMD ovat erikseen paljastaneet useita tärkeitä muutoksia x86-prosessoriensa arkkitehtuureissa, jotka lupaavat muuttaa tapaa, jolla x86-prosessoreita käytetään seuraavien vuosien aikana.

Viime viikolla AMD ilmoitti uudesta muistiarkkitehtuurista, jonka tarkoituksena on tuoda CPU- ja GPU-laskentatoimenpiteet lähemmäksi toisiaan. Intel paljasti uuden painopisteen asemansa parantamisessa perinteisempiin PC-grafiikoihin. Intel julkaisi eilen täysin uuden version Atom-prosessorien mikroarkkitehtuurista, jonka pitäisi tehdä noista siruista huomattavasti tehokkaampia ja mahdollisesti korjata aukko Atomin ja yrityksen yleisemmän Core-prosessoriperheen välillä.

AMD: n uusi muistiarkkitehtuuri

AMD: n ilmoitus siitä, mitä se kutsuu heterogeeniseksi yhtenäiseksi muistin käyttöoikeudeksi (hUMA), ei ollut suuri yllätys, koska yritys on puhunut jo pitkään heterogeenisesta järjestelmäarkkitehtuurista (HSA).

Konsepti on melko yksinkertainen. Jopa sirussa, jossa on sekä CPU että grafiikkaprosessointi (GPU) samalla suulakkeella, kuten AMD: n kiihdytetyissä prosessointiyksiköissä (APU), CPU: n ja grafiikan käyttämä muisti on pysynyt erillisissä ryhmissä. Vaikka fyysisesti sama muisti on, CPU ja GPU käyttävät erilaisia ​​osoittimia muistiin. GPU: n käyttämiseksi laskennassa ohjelman on kopioitava tiedot CPU: n käyttämästä muistin osasta grafiikan käyttämään osaan, suoritettava laskenta ja kopioitava uudelleen. Kaikki tämä vie aikaa. Todella yhtenäisellä grafiikkaa sisältävällä muistijärjestelmällä tämä ei ole tarpeen.

AMD ajaa tätä osana HSA-säätiötä, johon kuuluvat ARM, Qualcomm, Samsung, Texas Instruments, MediaTek ja Imagination. Erityisesti tämä lähestymistapa käyttää HSAIL-nimisenä ohjelmiston suoritusaikaa ja joukko rajapintoja HSA-kiihdytettyihin sovelluksiin.

Tällä viikolla AMD tarkensi, kuinka CPU ja GPU voivat hUMA-arkkitehtuurissaan dynaamisesti allokoida muistia koko muistitilasta ja käyttää sitä yhdessä saman virtuaalisen osoitusjärjestelmän kanssa. Muisti on kaksisuuntainen koherentti, joten muut prosessorielementit näkevät kaikki CPU: n tai GPU: n tekemät päivitykset muistiin. GPU tukee nyt siirrettävää muistia virtuaalisivuilla, joten se voi toimia suurempien tietojoukkojen kanssa (tapa, jolla suorittimet tällä hetkellä toimivat). Ajatuksena on, että CPU ja GPU voivat toimia yhdessä tehokkaammin. AMD: n mukaan kehittäjät pystyvät kirjoittamaan HSA-kiihdytettyjä sovelluksia käyttämällä tavallisia ohjelmointikieliä, kuten Python, C ++ ja Java.

AMD ei ole ainoa yritys, joka pitää heterogeenistä laskentaa tärkeänä, ja myös HSA-säätiöllä on kilpailijoita. Nvidia on ollut suuri kannattaja siihen, mitä se on aiemmin kutsunut GP-GPU: ksi, työntäen CUDA-sovellusliittymiään ja luvannut, että sen grafiikkaprosessorien tuleva versio tukee yhtenäistä muistia. Useilla isoilla ohjelmistoalustoilla on omat vaihtoehtonsa: Microsoftin DirectCompute-laajennukset DirectX: ään GP-GPU-tietojenkäsittelyä varten ja Googlen Renderscript-sovellusliittymä heterogeeniselle laskennalle. Ehkä tärkeintä, Khronos Group, teollisuuskonsortio, edistää OpenCL-standardia.

Suuri kysymys tulee olemaan, mitkä näistä standardeista houkuttelevat kehittäjiä. AMD: n ensimmäinen prosessori, joka tukee hUMA: ta, on sen Kaveri-prosessori, joka toimitetaan toimitettaviksi vuoden 2013 loppuun mennessä (tosin todennäköisesti ei järjestelmissä ensi vuoden alussa). AMD toimittaa myös APU: n PlayStation 4: lle, ja sen tunnetaan toimittavan APU: ta myös seuraavan sukupolven Xboxille. Vaikuttaa todennäköiseltä, että myös muut HSA-säätiön jäsenet voisivat käyttää hUMA-arkkitehtuuria, vaikka kukaan ei ole vielä ilmoittanut tällaisista malleista. Yhdessä tämä voisi riittää luomaan kriittisen massan kehittäjille ja työkaluille, ja jos niin, tämä voi osoittautua erittäin tärkeäksi.

Intel kaksinkertaistaa Haswellin grafiikan

Viime viikon lopulla Intel paljasti lisätietoja tulevasta 4. sukupolven ydinprosessoristaan, 22 nm: n tuotteesta, joka tunnetaan nimellä Haswell. Intel oli aiemmin paljastanut useita uusia ominaisuuksia Haswellille, mukaan lukien uudet AVX2-ohjeet työskentelemään suurempien kokonaislukuvektoreiden kanssa ja sulatetun kerrannaisen lisäys (FMA) -ohjeet liukulukuun. Nämä ovat asioita, joita loppukäyttäjät eivät todennäköisesti näe, paitsi parantamalla suorituskykyä melko erikoistuneissa työkuormissa.

Mielenkiintoisinta uudessa ilmoituksessa on keskittyminen grafiikkaan, alueelle, jolla kilpailijat AMD ja Nvidia ovat varmasti johtaneet.

Mutta Intel on ottamassa joitain suuria askeleita Haswell-prosessorien kanssa. Intel on jo kauan sanonut, että se lisää joihinkin Haswell-malleihin grafiikkaa, mukaan lukien korkealaatuinen versio, joka tunnetaan nimellä GT3. Käytännössä tämä on vain ylimääräisiä grafiikkaohjeyksiköitä, jotka ylittävät nykyisten Ivy Bridge -prosessorien määrät. Tämä itsessään on iso muutos, kun otetaan huomioon, että Intel on tuotteissaan yleensä omistanut enemmän die-tilaa CPU-tilaan, kun taas AMD: n kilpailevat APU: t ovat omistaneet enemmän die-tilaa grafiikkaan.

Mutta Intel esitteli äskettäin toisen version, jota se kutsuu GT3e-grafiikkaksi. Se lisää Haswell-suulaketta sisältävään pakettiin toisen muotin 128MB upotetulla DRAMilla ja on suunniteltu nopeuttamaan grafiikan suorituskykyä. Viime viikolla Intel ilmoitti, että GT3-grafiikan nopeampia versioita kutsutaan nyt Irisiksi, ja niitä, joissa on sulautettu DRAM, kutsutaan Iris Proksi, koska Intel toivoo saavansa jonkin verran tuotemerkkietuja grafiikan uusista tasoista.

Erityisesti Haswell-linja segmentoidaan versioilla, joissa on pieni määrä grafiikkaa (GT1), nimeltään HD Graphics; GT2-grafiikalla (joka vastaa Ivy Bridge -linjan huippua), nimeltään HD Graphics 4200 - 4600, nopeudesta riippuen; GT3-grafiikalla, mutta toimii 15 watin virralla, nimeltään HD Graphics 5000; Niitä osia, joiden GT3-grafiikka toimii 28 watin tai sitä suuremmalla nopeudella, kutsutaan nyt Intel Iris Graphics 5100: ksi; ja ne, joilla on GT3e-grafiikka ja sulautetut grafiikat, nimeltään Iris Pro 5200. (Intel ei ole koskaan ollut nimeämässä yksinkertaisuutta.)

Intelin osanumerot ovat edelleen monimutkaisia, mutta huomaa, että osanumero, joka alkaa 4: llä, osoittaa Haswellin, kun taas numero, joka alkaa 3: lla, osoittaa Ivy Bridge. Yhtiö käyttää MQ: ta osoittamaan GT3-kannettavan standardiosat ja HQ: n osoittamaan osia, joissa on sulautettu DRAM.

Osana ilmoitusta Intel jakoi uusien osien suoritusnumerot osoittaen merkittäviä suorituskyvyn parannuksia verrattuna yhtiön nykyisiin prosessoreihin. Intel osoitti lukuja, jotka viittaavat siihen, että Ultrabook-suorituskyky on jopa 1, 5-kertainen edelliseen sukupolveen suunnilleen samalla energiankulutuksella (ja kaksinkertainen suorituskyky korkeamman tehon piirillä, joka on tarkoitettu hiukan isommille kannettaville, niille, joissa on 14-tuumainen ja suurempi näyttö), kaksi kertaa grafiikka suorituskyky perinteisissä muistikirjoissa ja melkein kolme kertaa suorituskyky pöytäkoneissa.

Intelin mukaan uudet Iris- ja Iris Pro -grafiikat ovat verrattavissa erillisiin GPU: hin, ja se on iso juttu. (Kuten aina, otan kaikki suoritusnumerot suolajyvällä, kunnes voin tosiasiallisesti testata tuotteita.) Olen varma, että AMD: ltä ja Nvidialta löytyy edelleen paljon suorituskykyisempiä erillisiä työpöytägrafiikkaosia pelaamista ja työasemasovelluksia varten, mutta yleensä nämä osat käyttävät paljon virtaa. Täysikokoisissa kannettavissa tietokoneissa, joissa sähkökuori on paljon pienempi, on-grafiikka on tärkeämpää, mutta erillisille grafiikoille on silti ollut suuri markkina. Intel näyttää kohdistavan kyseisiin markkinoihin. Ultrakirjoilla ja muilla ohuilla kannettavilla ei yleensä ole ollut virran tarvetta erillisten grafiikoiden suorittamiseen, joten parannetut on-die-grafiikat ovat varmasti tervetulleita.

Intelin uusi Atom-mikroarkkitehtuuri

Intelin suurimpana ilmoituksena monessa suhteessa oli kuitenkin sen pienitehoinen arkkitehtuuri, jonka tarkoituksena on korvata yrityksen nykyisessä Atom-arkkitehtuurissa käytetty arkkitehtuuri. Atom-perhe tunnetaan enimmäkseen mobiililaitteissa, kuten tablet-laitteissa ja vähäisemmässä määrin muutamissa älypuhelimissa. Uusi arkkitehtuuri, joka tunnetaan nimellä Silvermont, on myös suunnattu monille datakeskuksille ja sulautetuille markkinoille.

Arkkitehtuuri edustaa suurta muutosta. Aiemmissa Atom-arkkitehtuuriversioissa käytetyn tilausmääräysten suorittamisen moottorin sijasta, mukaan lukien Saltwell-arkkitehtuuri, jota käytettiin yrityksen nykyisissä 32nm Atom -versioissa, Silvermont lisää tilausten ulkopuolelle jäävän suorittamisen moottorin, jota käytetään Intelin Core- ja Xeon-prosessoreissa.. Tämän pitäisi parantaa merkittävästi yksisäikeistä sovellusten käsittelyä. Se tarjoaa uuden järjestelmäkangasarkkitehtuurin, joka on suunniteltu skaalaamaan jopa kahdeksan ydintä (todennäköisimmin sovelluksissa, kuten mikropalvelimet). Lopuksi se lisää uusia ohjeita (jotta se olisi samanlainen kuin Core-prosessorien Westmere-versiossa käytettyjen ohjeiden kanssa) sekä uudet turvallisuus- ja virtualisointitekniikat.

Uudella arkkitehtuurilla on modulaarinen suunnittelu, joka perustuu moduulien ympärille, jotka sisältävät kaksi ydintä, 1 Mt jaettua L2-välimuistia (erittäin pieni viive, suuri kaistanleveys) ja omistettu pisteestä pisteeseen -liitäntä SoC-kankaalle. Huomaa, että tämä korvaa Intelin voimakkaasti edistämän monisäikeisen käsitteen, ja kuulostaa itse asiassa hiukan kuin AMD: n modulaarinen lähestymistapa, jota käytetään sen nykyisissä työpöytä- ja palvelinpiirissä. (Intel kuitenkin selvitti, ettei se ollut sama asia; AMD: n moduulit jakavat enemmän asioita mukaan lukien liukuluku). Moduulit voidaan yhdistää sisältämään jopa kahdeksan ydintä.

Intelin mukaan uusi arkkitehtuuri mahdollistaa virrankulutuksen laajemman dynaamisen tehoalueen ja antaa jokaiselle ytimelle oman riippumattoman taajuuden ja virranhallinnan, antaen siten jokaiselle siirtyä ylös ja alas suorituskyvyn ja virrankulutuksen suhteen. (Toisin kuin liikkuvien prosessorien kanssa, tämä on enemmän kuin Qualcomm käyttää Krait-ytimillään kuin tavallisempi ARM big.LITTLE -yhdistelmä.) Se on myös suunniteltu tehostamaan virranhallintaa ja nopeampaa siirtymistä valmiustilaan ja poistumista valmiustilasta, ominaisuudet, jotka ovat erityisen tärkeitä. matkaviestinmarkkinoilla.

Yrityksen mukaan se pystyy paremmin säätämään tehoa prosessorin ytimen ja muiden elementtien, kuten grafiikan, välillä, mikä mahdollistaa pursketilan hienostuneemman toteutuksen.

Kaiken kaikkiaan Intel sanoo, että uuden arkkitehtuurin ja siirtymisen yrityksen 22 nm: n FinFet SoC -prosessiin pitäisi sallia sirut, jotka tarjoavat jopa kolme kertaa suuremman suorituskyvyn tai viisi kertaa vähemmän tehoa kuin nykyiset Atom-sirut. Yleisesti ottaen Intel sanoi, että sen "tehokas" kaksoisydin voi ylittää tehottoman nykyisen neliytimisen prosessorin tehon rajoitteissa. (Jälleen, kuten aina, odotan, että tuotteet arvioivat tämän.)

Kuten nykyinen Atom-linja, Silvermont-arkkitehtuuria käytetään todennäköisesti useissa prosessoreissa, aina mobiililaitteille suunnattuihin ja suurempiin järjestelmiin. Näihin tulisi kuulua Avoton, joka on suunnattu mikropalvelimille, Rangely, joka on tarkoitettu verkkolaitteille, Merrifield, joka on tarkoitettu älypuhelimiin, ja Bay Trail, joka on tarkoitettu tablet-laitteille ja muunneltaville. Näistä eniten odotettu on 22nm Bay Trail -alusta, jonka Intel odottaa olevan markkinoilla hyvissä ajoin, jotta tabletit olisivat saatavana lomakauteen mennessä, ja lisätietoja saadaan pian.

Kaiken kaikkiaan Silvermont-arkkitehtuuri kuulostaa suurelta askeleelta nykyisestä Atom-arkkitehtuurista, ja olen erityisen kiinnostunut näkemään, kuinka tähän arkkitehtuuriin perustuva Bay Trail todella toimii. Tähän päivään mennessä Core-perheen ja huippuluokan atomien välillä on ollut huomattava suorituskuilu, mutta tämä arkkitehtuuri näyttää siltä, ​​että se voisi todella täyttää aukon.

Johtopäätös: Grafiikka ja teho määrittelevät kilpailun

Jokaisella nykyisellä suurimmalla prosessorilla - onko tietokoneisiin tai kannettaviin tietokoneisiin tarkoitettu Intel- tai AMD-siru vai älypuhelimiin ja tablet-laitteisiin tarkoitettu ARM-pohjainen siru - on useita CPU-ytimiä, tyypillisesti useita GPU-ytimiä (paitsi palvelinpiirejä) ja kaikenlaisia muu erikoistunut logiikka esimerkiksi kuvankäsittelyyn, videokoodaukseen ja dekoodaukseen sekä salauksen käsittelemiseen.

Kun siruprosessi pienenee, yhdelle sirulle voidaan sisällyttää enemmän transistoreita. Mutta mitkä ominaisuudet integroidaan (ja miten ne voidaan integroida), on edelleen tärkeä erottaja sirujen myyjien keskuudessa, samoin kuin sirujen erityinen suunnittelu ja mikroarkkitehtuuri.

Nämä ilmoitukset osoittavat kompromisseja, joita Intel ja AMD tekevät, ja näillä tulisi olla valtavia vaikutuksia tietojenkäsittelyyn seuraavien vuosien aikana.

Pöytätietokoneiden ja kannettavien tietokoneiden osalta Intel näyttää siltä, ​​että se ei vain yrittäisi saavuttaa AMD: tä sisäänrakennetulla grafiikan suorituskyvyllä lisäämällä lisää suoritusyksiköitä, vaan yrittäisi myös siirtyä eteenpäin ominaisuuksien kuten upotetun DRAM: n kanssa hyödyntämällä prosessitekniikkaansa johtaa. AMD ei myöskään istu paikallaan grafiikansa kanssa, joten sen pitäisi tehdä mielenkiintoisesta ottelusta. Samaan aikaan AMD pyrkii integroimaan paremmin grafiikan ja prosessorin ominaisuuksia, mikä voi johtaa uuteen ohjelmointitapaan; se vie kauemmin, mutta voi osoittautua uskomattoman tärkeäksi.

Taistelu AMD: n Kaverin ja Intelin Haswellin välillä saattoi siis olla mielenkiintoisempi kuin viime vuosien Intel-AMD-kilpailu. Haswell toimittaa varmasti ensin. (Odotan näkevänsä järjestelmät tänä kesänä verrattuna ensi vuoden alussa Kaveriin.) Tämä on taas enimmäkseen valtavirran työasemille ja muistikirjoille. Pelaajat ja työaseman käyttäjät haluavat edelleen epäilemättä yhdistää jommankumman sirun erillisillä grafiikkaratkaisuilla joko AMD: ltä tai Nvidialta.

Tablettien ja mahdollisesti lopulta puhelimien kohdalla heterogeeninen järjestelmäarkkitehtuurimenetelmä, jota AMD ja muut ajavat, voisi osoittautua vielä tärkeämmäksi, vaikka taaskin vie jonkin aikaa nähdä, hyödyntävätkö sovellukset sitä todella. Intelin uuden arkkitehtuurin pitäisi tehdä siitä kilpailukykyisempi tässä tilassa. Se todella näyttää siltä, ​​että se on iso askel eteenpäin, mutta myös sen kilpailijat jatkavat liikkumistaan.

Olen hieman utelias, ajavatko Atomin Silvermont-pohjaisen Bay Trail -alustan kaltaiset tosiasiallisesti riittävän nopeasti, jotta se alkaa näkyä yleisemmissä huippuluokan muistikirjoissa tai jopa pöytätietokoneissa. Jo nykypäivän Atom-pohjaiset tabletit käyttävät Windowsia kohtuullisen hyvin, ja parannuksilla se voisi olla tarpeeksi monille pääkäyttäjille, vaikka se jääkin Haswellin tai Kaverin (tai Intelin nykyisen Sandy Bridge ja AMD: n nykyisen Richmondin) suorituskykyyn, asia).

Sen pitäisi tehdä jännittävästä kilpailusta seuraavana vuonna.

Amd ja Intel avaavat grafiikan eteen prosessoritaistelussa