Koti Etukäteen ajattelu Ivytown, höyryrullain, 14 ja 16 nm: n prosessi korostaa isscc

Ivytown, höyryrullain, 14 ja 16 nm: n prosessi korostaa isscc

2024

Video: Tom The Tow Truck with his friend Steve the Steamroller | Trucks Cartoon for kids (Marraskuu 2024)

Vaikka sirujen myyjät eivät yleensä esittele uusia siruja vuotuisessa kansainvälisessä solid Solution State Circuits -konferenssissa (ISSCC), he antavat usein lisätietoja jo ilmoitettujen tuotteiden sisäisestä toiminnasta. Tässä on joitain asioita, jotka minusta kiinnostuivat tämän viikon näyttelyssä.

Intelin Ivytown-palvelinarkkitehtuuri

Intel keskusteli Xeon E7 -prosessoriperheensa uusimmasta versiosta, sirusta, jossa voi olla jopa 15 ydintä ja 30 säiettä, nimeltään Ivytown. Se perustuu Ivy Bridge EP -arkkitehtuuriin, jota käytetään Xeon E5 2600 V2: ssa. Prosessori on rakennettu käyttäen Intelin 22 nm prosessitekniikkaa ja Tri-Gate-transistoreita (evien korkeus on 34 nm ja leveys 8 nm), ja se korvaa nykyisen Westmere EX -pohjaisen Xeon E7: n. Vertailun vuoksi, nykyisessä Xeon E7: ssä, jota tuotetaan 32 nm: n tasomaisella HKMG-prosessorilla, on 10 ydintä ja 20 säiettä, ja siinä on 30 Mt L3-välimuistia verrattuna 37, 5 Mt Ivytown-versiossa.

Yksi mielenkiintoisimmista tämän uuden prosessoriperheen ominaisuuksista on sen modulaarinen arkkitehtuuri. Pohjapiirros koostuu kolmesta viiden ytimen sarakkeesta, joissa jokaisessa on oma viipale L3-välimuistia, upotettu rengasväylä ja omistettu IO kolonnien ylä- ja alaosassa (QPI-linkit ylhäällä ja muistiohjaimet alaosassa). Intel aikoo luoda 10 ytimen version poistamalla oikeanpuoleisen sarakkeen; ja luoda 6-ytinen versio poistamalla kaksi riviä edelleen.

15 ytimen versiossa on 4, 31 miljardia transistoria - mikä Intelin mukaan on kaikille mikroprosessoreille eniten - ja sen mitat ovat 541 neliömetriä. 10 ytimen versiossa on 2, 89 miljardia transistoria, ja sen mitat ovat 341 neliö millimetriä. 6-ytäisessä variantissa on 1, 86 miljardia transistoria, ja sen mitat ovat 257 neliömetriä. Toimintataajuudet ovat välillä 1, 4 GHz - 3, 8 GHz, TDP: n ollessa välillä 40 W - 150 W.

Toinen mielenkiintoinen osa Ivytownia on sen muistipuskuriarkkitehtuuri. Sama muotti tukee tavallista nelikanavaista DDR3-muistia, joka toimii nopeudella 1867MT / s, ja uutta nelikanavaista jännitemoodin yksisyistä (VMSE) -liitäntää muistin laajennuspuskuriin, joka toimii nopeudella 2667 MT / s. Kaiken kaikkiaan se tukee jopa 12 kt muistia 8-pistorasiaisella palvelimella - kolme kertaa Westmere EX: n muistikapasiteetti. 15 ytimen versio on saatavana kahdessa eri paketissa: yksi, joka on yhteensopiva nykyisen Romley-alustan (Socket-R) kanssa päivitysten helppoa varten, ja toinen, joka mahdollistaa uuden alustan, joka käyttää muistipuskureita.

Lisää Haswell-yksityiskohtia

Intel antoi myös joukon yksityiskohtia Haswell-arkkitehtuurista, jota käytetään nykyisessä Core-perheessä. Tämä käyttää myös 22 nm: n Tri-Gate-transistoreita. Intelin mukaan Haswell integroi useita uusia tekniikoita, mukaan lukien täysin integroitu jännitesäädin tai FIVR (yhdistämällä alusta viidestä jännitesäätimestä yhdeksi), upotettu DRAM-välimuisti paremman grafiikan suorituskyvyn, pienemmän virran tilan, optimoidun IO-, AVX2-ohjeiden ja leveämpi SIMD-kokonaislukuyksikkö.

Haswellillä on kolme perusvarianttia: Ensinnäkin on nelinytiminen, joka kommunikoi erillisen PCH: n (Platform Controller Hub) kanssa nopeamman grafiikan kanssa (kahdesta neljään ytimeen). Toiseksi on olemassa ultrakirjoitusalusta, joka yhdistää kaksoisytimisen Haswellin ja PCH: n yhdessä, monisirisessa paketissa. Suoritin tukee pienempiä virrantiloja, PCH: ta muutetaan pienemmälle virralle, ja nämä kaksi kommunikoivat pienitehoisen väylän kautta, mikä kaikki vähentää valmiustilan tehoa 95 prosentilla. Viimeinkin samassa paketissa on versio, jossa on Iris Pro -grafiikka ja 128 Mt eDRAM-välimuisti. Monisiruksiset paketit käyttävät paketissa olevaa IO: ta, joka tarjoaa suuren kaistanleveyden pienellä teholla CPU: n ja PCH: n ja eDRAM: n välillä.

Prosessorisydämien lukumäärästä ja grafiikasta (GT2 tai GT3) riippuen Haswellillä on missä tahansa 960 miljoonasta 1, 7 miljardiin transistoria ja muottimen mitat ovat 130 - 260 neliömetriä. Se on suunniteltu toimimaan 0, 7 - 1, 1 voltilla laajassa taajuusalueella 1, 1 - 3, 8 GHz.

128 Gt: n eDRAM-suulake on 77 neliömetriä ja sen suurin kaistanleveys on 102 Gt / s. Intel sanoi, että verrattuna samaan järjestelmään, jossa ei ole eDRAM: ää, lisävälimuisti tuottaa jopa 75 prosentin suorituskyvyn voiton, vaikka kokonaistehokkuus nouseekin 30–40 prosentilla.

AMD: n Steamroller Powers Kaveri

AMD, joka pyrkii lisäämään grafiikkaa niin kutsuttuihin nopeutettuihin prosessoriyksiköihinsä (APU: een tai prosessoreihin, joissa yhdistyvät CPU: t ja grafiikat) keskittyi uuteen CPU-ytimeensä, joka tunnetaan nimellä Steamroller ja jota käytetään yrityksen uudessa Kaveri-prosessorisarjassa. Steamroller-ytimessä, joka tuotetaan 28 nm: n irtotavarana CMOS-prosessissa, on 236 miljoonaa transistoria alueella 29, 47 neliömetriä. Tämä sisältää kaksi kokonaislukuaytintä, kaksi käskydekoodausyksikköä ja useita jaettuja elementtejä, mukaan lukien käskyhaku, liukulukuyksikkö ja 2MB L2-välimuistia. AMD käyttää tyypillisesti yhtä näistä Steamroller-moduuleista "dual-core" -siruissaan (heijastaa 2 kokonaislukua); ja kaksi sen "neliytimisissä" siruissa.

Verrattuna aikaisempaan Piledriver-ytimeen, joka tuotettiin 32 nm: n SOI-prosessilla, Steamroller lisää toisen käskydekoodausyksikön, suuremman 96 kt: n jaetun käskyvälimuistin ja muut parannukset. AMD: n mukaan tämä johti jopa 14, 5 prosenttia enemmän ohjeita jaksoa kohden, mikä tarkoittaa 9 prosentin parempaa suorituskykyä yksisäikeisissä sovelluksissa ja 18 prosenttia parempaa suorituskykyä kaksisäikeisissä sovelluksissa. Se voi myös toimia 500MHz suuremmalla taajuudella samalla teholla tai antaa suunnilleen saman suorituskyvyn 38 prosentin tehonvähennyksellä. Steamroller-ydin on suunniteltu toimimaan välillä 0, 7–1, 45 volttia.

Matkapuhelimen prosessorit MediaTekiltä, Renesasilta ja Qualcommilta

Useat yritykset pitivät esityksiä ARM-pohjaisista prosessoreistaan.

MediaTek puhui 28 nm: n heterogeenisesta moniytimisestä prosessoristaan (HMP), jossa on nelinytinen CPU ja kaksois-GPU. MediaTek-sirussa on kaksi Cortex A15-ydintä, joiden taajuus on 1, 8 GHz, ja kaksi Cortex A7-ydintä, joiden aalto toimii 1, 4 GHz: llä, yhdistettynä Imagination G6200 400MHz: n kaksoisytimellä olevaan GPU: hon. Siinä on myös täysi HD-laitteistovideokoodekki ja 13 megapikselin kuva-anturiprosessori.

MediaTek puhui myös PTP (Performance, Thermal ja Power) -tekniikasta, joka tarkkailee sirua ja säätelee virtaa. Tässä tapauksessa yrityksen mukaan PTP sallii kellonopeuden kasvattamisen 23 prosentilla tai jopa 41 prosentin virransäästöllä.

Tämä siru käyttää ARM: n todellista HMP-prosessointia, mikä tarkoittaa, että mikä tahansa isojen ja pienten ytimien yhdistelmä yhdestä neljään voi toimia työkuormasta riippuen. MediaTek kertoi, että käyttämällä aitoa HMP: tä, siru voi tuottaa 33–51 prosenttia paremman suorituskyvyn raskaissa työkuormissa tai 2–5 kertaa paremman energiatehokkuuden kevyissä työkuormissa, kun taas mukautuva lämmönhallinta tarjoaa vielä 10 prosenttia suorituskyvyn parannuksen.

Renesas esitteli "ehdotetun" 28 nm: n HPM: n kahdeksan ytimen heterogeenisen prosessorin, joka on suunniteltu mobiililaitteille ja autojen viihdejärjestelmille. Siru käyttää neljää 2 GHz Cortex A15 -ydintä ja neljä 1 GHz Cortex A7 -ytintä. Se pystyy käyttämään kaikkia 8 ydintä samanaikaisesti parhaan mahdollisen suorituskyvyn saavuttamiseksi, mutta se käyttää myös heterogeenistä arkkitehtuuria ja virranhallintatekniikoita suorituskyvyn optimoimiseksi tietyille työmääräille tai tehokuorille.

Qualcomm kuvasi digitaalista Hexagon-signaaliprosessoriaan, jota käytetään mobiileissa SoC-laitteissaan moniin multimedia- ja modeemisovelluksiin. Nykyinen versio on valmistettu 28 mm: n HKMG-irtotavarana CMOS-prosessista. Tämä malli kohdistaa korkeat ohjeet per kello toisin kuin korkeat toimintataajuudet.

ARM-palvelinpuolella Applied Micro puhui yrityksen ensimmäisen sukupolven 64-bittisestä ARMv8-prosessorista, josta ilmoitettiin ensimmäisen kerran äskettäisessä Open Compute -huippukokouksessa. Tämä perustuu "Potenza" -prosessorimoduuliin (PMD), joka sisältää kaksi ydintä, jotka jakavat 256 kt L2-välimuistia. Potenza on valmistettu 40 nm: n irtotavarana CMOS: ksi, ja jokainen PMD sisältää 84 miljoonaa transistoria ja käyttää 14, 8 neliö millimetriä suulakealuetta. Se voi toimia jopa 3GHz: n taajuudella 0, 9 volttia, mutta keskimäärin 4, 5 W tyypillisissä työkuormissa. X-Gene 3 -palvelinalusta sisältää neljä PMD: tä (kahdeksan ydintä), jaetun 8 Mt: n L3-välimuistin ja neljä DRAM-muistikanavaa keskuskytkimen ympärillä. Se integroi myös 10 Gt Ethernet, SATA 2/3, PCIe Gen. 3 ja USB 3.0.

Chip Process Tech -sovelluksen seuraava sukupolvi

Oli myös pari esitystä seuraavan sukupolven siruprosessitekniikasta, koska melkein kaikki suuret sirunvalmistajat suunnittelevat siirtyvänsä 3D- tai FinFET-tuotantoon 14 tai 16 nm: n solmussa (seuraa Inteliä, joka toimittaa jo 22 nm: n siruja) sellaisella tekniikalla).

Samsung puhui tulevasta 14 nm: n FinFET-prosessista, joka osoitti 128 Mt 6T SRAM -sarjan ja testisirun. Samsung sanoi, että FinFET-laitteet ovat hyvä ratkaisu pienitehoisiin mobiililaitteisiin, koska ne tarjoavat hyvän skaalauksen, korkean virran ja pienen vuodon ja niillä on hyvä lyhyen kanavan hallinta.

Tämä asettaa myös joitain haasteita SRAM: ille, koska SRAM: n syöttöjännite ei ole ollut skaalaus. SRAM kuluttaa nyt 20-30 prosenttia SoC: n suulakepinta-alasta, mutta se käyttää noin 40-50 prosenttia voimasta. Näiden kysymysten ratkaisemiseksi Samsung ehdotti joitain uusia tekniikoita SRAM: ien käyttämiseksi FinFET-transistoreilla matalammalla syöttöjännitteellä.

TSMC käsitteli samanlaisia ongelmia osoittaen 16 nm 128Mb SRAM-sirunsa. TSMC: n mukaan FinFET-laitteista on tullut yleinen tekniikka yli 20 nm: n tuotantoon, mutta sanoi, että kanavan leveyden ja pituuden koko FinFET-laitteilla on haaste perinteisen 6T-SRAM: n ja syöttöjännitteen skaalaamiselle. TSMC ehdotti kahta kirjoitusavustekniikkaa näiden ongelmien ratkaisemiseksi.

Nämä ovat melko teknisiä kysymyksiä, mutta niiden ratkaiseminen on kriittistä, jos haluamme tulevaisuudessa saada tiheämpiä, tehokkaampia siruja.