Diit.cz - Novinky a informace o hardware, software a internetu

2,6 bilionu tranzistorů a 1 čip na 7nm wafer: Cerebras WSE-2

Po roce a půl uvádí společnost Cerebras druhou generaci celowaferového monolitu, AI-procesoru Wafer Scale Engine. Jeho parametry nepřestávají ohromovat…

Historie společnosti Cerebras se váže k ex-šéfovi společnosti SeaMicro (kterou koupilo a fakticky zabilo Readovo vedení AMD), A. Feldmanovi, který společně s S. Liem přišel na myšlenku AI-procesoru postaveného na celém křemíkovém waferu. První generaci představili v listopadu 2019 a jejími parametry zaujali média po celém světě. Čip o ploše 46 225 mm², se 400 tisíci jádry, 1,2 bilionu tranzistorů a TDP 16 tisíc wattů totiž nelze přehlédnout.

 CerebrasNvidiarozdíl
konkur.
WSE-1WSE-2GV100GA100
proces16nm7nm12nm7nm-
plocha46 225 mm²815 mm²826 mm²57 / 56×
jader400 000850 0005120+2566912+128078 / 123×
int. paměť18 GB40 GB6 MB40 MB3k / 1k×
paměť. prop.9 PB/s20 PB/s900 GB/s1555 GB/s10k / 13k×
prop. sběrn.100 Pb/s220 Pb/s300 Gb/s600 Gb/s333k / 367×
tranzistorů1,2 bilionu2,6 bilionu21 miliard54,2 miliard57 / 48×
TDP16 kW23 kW0,3 kW0,4 kW53 / 58×

Cerebras se chlubí 100% výtěžností, ta je však dosahována faktem, že návrh obsahuje zhruba o procento více jader, než je uváděno (redundance), a chybná jsou vypínána. Společnost ráda srovnává parametry svého produktu s výpočetním řešením od Nvidie, takže jsem obě generace (včetně rozdílů) shrnul do jedné tabulky.

Ačkoli čip o velikosti waferu může působit úctyhodně a z technologického hlediska jde skutečně o velmi zajímavý počin, po stránce implementace nejde až tak úplně o monolit. Výrobní linky mají limity co do maximální velikosti čipu, takže WSE-2 (stejně jako WSE-1) je spíše implementací většího počtu čipů na jednom nerozřezaném waferu, kdy se oproti klasickým čipům liší pouze faktem, že mezi jednotlivými sousedícími čipy je ve waferu implementováno propojení. Ve své podstatě jde jen o jiný způsob propojení čipů než využívá Intel (můstky) nebo AMD (GMI nebo interposer).

WSE sice  můstky, GMI ani interposer nepotřebuje, ale zase se musí potýkat s jinými komplikacemi a to je tepelná roztažnost, která dala vývojovému týmu zabrat už u první generace. Při koncové ceně za „čip“ přes 2 miliony dolarů u první generace tudíž nejde zrovna o masové řešení.

Cerebras si sice nějaké zákazníky získala, uvádí použití ve výzkumných laboratořích, farmaceutických firmách, biotechnologickém výzkumu, armádě a ropném průmyslu, ale konkrétní známé údaje nenaznačují masovější nasazení. Lawrence Livermore má používat jeden systém (1 systém = 1 „čip“) první generace a výpočetní centrum Pittsburg má dva systémy (což vstoupilo ve známost díky tomu, že na jejich nákup dostalo grant, jehož popis je veřejně dostupný). Prozatím to vypadá, že jsou zmíněné subjekty vybaveny jedním-dvěma systémy, na kterých testují, do jaké míry jsou pro ně použitelné, výhodné, smysluplné, rentabilní…

Na jedné straně tak Cerebras nemá zakázky na superpočítače v řádu stovek milionů dolarů, jako velcí hráči v tomto segmentu (pokud je známo, tak ani zakázky na superpočítače v řádu desítek milionů dolarů) a na straně druhé - z důvodu gigantického monolitu - nemůže WSE škálovat do nižších cenových relací, takže z principu nemůže získávat menší zakázky v řádu stovek tisíc dolarů. Což je nutné zohlednit jako poměrně nezanedbatelnou strategickou nevýhodu. Pokud se společnost podaří v dlouhodobém horizontu uchytit, troufám si prorokovat, že dříve či později stejně svůj wafer „přeřízne“, aby mohla expandovat i do dalších cenových segmentů.

Cena systému CS-2 (tedy systému s jedním WSE-2) zatím nebyla zveřejněna, ale zatímco u první generace se podle zákazníka a konfigurace pohybovala kolem $2-3 milionů, uvádí výrobce, že v době dostupnosti (třetí kvartál 2021) dosáhne „několika milionů dolarů“, což je většinou médií chápáno jako částka vyšší než u původní generace (pokud by byla nižší nebo stejná, neměl by výrobce důvod k marketingovým manévrům v podobě nejasných formulací).

Diskuse ke článku 2,6 bilionu tranzistorů a 1 čip na 7nm wafer: Cerebras WSE-2

Pondělí, 26 Duben 2021 - 12:27 | PPK | Jasne, jenze ty to mas ze sveho pohledu maleho...
Pondělí, 26 Duben 2021 - 12:20 | maximumspeed | tezebni karty jsou k hovnu, protoze je nejde...
Pondělí, 26 Duben 2021 - 12:16 | PPK | Kdyby nejaky ten vliv v kryptokomunite nvidie...
Neděle, 25 Duben 2021 - 18:06 | danieel | Ja nevim co resite. Ta firma to chlazeni vyreseno...
Neděle, 25 Duben 2021 - 17:54 | Wladows | Počítal jsem to a vyšlo mi cca 50 W/cm^2, což je...
Neděle, 25 Duben 2021 - 00:03 | Spirit_pcf | Nezmysel..
Sobota, 24 Duben 2021 - 22:54 | Spirit_pcf | Zivotnost krati sucinitel napatia a teploty. A...
Sobota, 24 Duben 2021 - 22:49 | Spirit_pcf | Tak iste.. Pretoze vubec, ale vubec neni rozdiel...
Sobota, 24 Duben 2021 - 20:22 | maximumspeed | A tak urcite jim asic stroje uziraji kseft s...
Sobota, 24 Duben 2021 - 19:39 | RedMaX | Ok, tvemu komentari rozumim, ale furt si rikam,...

Zobrazit diskusi