NVIDIA наступным пакаленнем Blackwell AI Chips сутыкаецца з сур'ёзнымі праблемамі перагрэву пры ўсталёўцы ў стэлажах з высокай магутнасцю.Гэтыя праблемы прывялі да распрацоўкі змяненняў і затрымкі, і выклікалі занепакоенасць сярод такіх кліентаў, як Google, Meta і Microsoft аб своечасовым разгортванні сервераў Blackwell.
Інсайдэры паказалі, што GPU Blackwell Nvidia можа перагрэцца пры выкарыстанні на серверах з 72 чыпамі.Чакаецца, што гэтыя прылады спажываюць да 120 кВт магутнасці на стойку.Гэтыя праблемы прымусілі NVIDIA некалькі разоў ацаніць дызайн сервера, бо перагрэў можа абмежаваць прадукцыйнасць графічнага працэсара і ўяўляць рызыку пашкоджання кампанентаў.Кліенты занепакоеныя тым, што гэтыя няўдачы могуць перашкодзіць іх графіку разгортвання новых чыпаў у цэнтры апрацоўкі дадзеных.
Згодна з паведамленнямі, NVIDIA даручыла сваім пастаўшчыкам унесці некалькі змяненняў у дызайне ў стойку для вырашэння пытанняў перагрэву.Кампанія цесна супрацоўнічае са сваімі пастаўшчыкамі і партнёрамі па распрацоўцы інжынерных пераглядаў, каб палепшыць астуджэнне сервера.Хоць гэтыя карэкціроўкі з'яўляюцца стандартнай практыкай для такога маштабнага выпуску тэхналогій, яны ўсё яшчэ дадаюць затрымкі і яшчэ больш затрымліваюць чаканую дату дастаўкі.
Згодна з дакладам First Financial, у адказ на затрымкі і перагрэў, прэс -сакратар NVIDIA заявіў: "Мы працуем з вядучымі пастаўшчыкамі хмарGB200, самая перадавая сістэма на сённяшні дзень, у розныя асяроддзі цэнтраў апрацоўкі дадзеных патрабуе сумеснага дызайну з нашымі кліентамі ".NVIDIA таксама заявіла, што "кліенты ў цяперашні час карыстаюцца магчымасцямі рынку для сістэм GB200.
Раней NVIDIA павінна была адкласці вытворчасць Blackwell з -за дэфектаў дызайну пры ўраджайнасці чыпаў.Blackwell B100 і B200 NVIDIA выкарыстоўваюць тэхналогію ўпакоўкі TSMC Sowos-L, каб падключыць свае два мікрасхемы.Гэтая канструкцыя ўключае ў сябе прамежкавы пласт RDL з мостам LSI (Local Silicon Interconnect), які падтрымлівае хуткасць перадачы дадзеных да 10 ТБ/с.Дакладнае размяшчэнне гэтых мастоў LSI мае вырашальнае значэнне для працы тэхналогіі, як чакалася.Аднак неадпаведнасць характарыстык цеплавога пашырэння паміж чыпамі GPU, мастамі LSI, праслойкамі RDL і субстратамі матчынай платы прывялі да дэфармацыі і збояў у сістэме.Для вырашэння гэтага пытання NVIDIA змяніла верхні металічны пласт і структуру Bump GPU Silicon для павышэння надзейнасці вытворчасці.
Такім чынам, канчатковы перагледжаны GPU Nvidia Blackwell пачне масавую вытворчасць толькі ў канцы кастрычніка, а значыць, Nvidia зможа адправіць гэтыя чыпы з канца студзеня наступнага года.
Кліенты NVIDIA, у тым ліку тэхналагічныя гіганты, такія як Google, Meta і Microsoft, выкарыстоўваюць GPU NVIDIA для падрыхтоўкі сваіх самых магутных вялікіх моўных мадэляў.Затрымка GPU Blackwell AI, натуральна, паўплывае на планы і прадукты кліентаў NVIDIA.