Процессоры ИИ будут потреблять до 15 кВт. Это потребует изощренных технологий охлаждения
Эксперты упоминают два ключевых нововведения: линии теплопередачи (TTL), которые перемещают тепло от горячих точек к охлаждающим интерфейсам, и жидкостные TSV (F-TSV), которые позволяют охлаждающей жидкости циркулировать вертикально через стек HBM. Эти методы интегрируются непосредственно в межслойную пластину и кремний для поддержания тепловой стабильности.
До недавнего времени для охлаждения процессоров Nvidia H100 AI было достаточно высокопроизводительных систем воздушного охлаждения, включающих медные радиаторы и вентиляторы высокого давления. Однако, когда Nvidia увеличила рассеиваемую мощность Blackwell до 1200 Вт, а затем Blackwell Ultra — до 1400 Вт, решения с жидкостным охлаждением стали практически обязательными. С Rubin, который увеличит свою мощность до 1800 Вт, и с Rubin Ultra, который удвоит количество чиплетов графического процессора и модулей HBM, а также увеличит мощность до 3600 Вт, ситуация становится ещё более напряжённой. Исследователи из KAIST считают, что Nvidia и её партнёры будут использовать жидкостное охлаждение с прямым подключением к чипу (D2C) с Rubin Ultra, но с Feynman им придётся использовать что-то более мощное.
Исследователи из KAIST прогнозируют, что модули ИИ-графики (в частности, Nvidia Feynman) будут потреблять 4400 Вт, в то время как некоторые другие отраслевые источники считают, что Nvidia Feynman Ultra увеличит свою мощность до 6000 Вт. Такие экстремальные температуры потребуют использования иммерсионного охлаждения, при котором целые модули GPU-HBM погружаются в охлаждающую жидкость. Кроме того, ожидается, что такие процессоры и их модули HBM будут оснащены тепловыми переходными отверстиями (TTV) — вертикальными каналами в кремниевой подложке, предназначенными для отвода тепла. Они будут сопряжены со слоями термопасты и температурными датчиками, встроенными в базовый кристалл модуля HBM, для мониторинга температуры в реальном времени и управления с обратной связью.
Ожидается, что водяное охлаждение будет достаточно эффективным до 2032 года, когда в архитектурах графических процессоров после Фейнмана энергопотребление на один пакет увеличится до 5920 Вт (после Feynman) или даже до 9000 Вт (после Feynman Ultra).
Следует отметить, что основными потребителями энергии в модуле графического процессора являются вычислительные чипы. Однако, поскольку количество стеков HBM увеличивается до 16 в пост-фейнмановском режиме, а энергопотребление каждого стека увеличивается до 120 Вт в режиме HBM6, энергопотребление памяти составит около 2000 Вт, что составляет примерно 1/3 от общей мощности.
Сообщение Процессоры ИИ будут потреблять до 15 кВт. Это потребует изощренных технологий охлаждения появились сначала на Время электроники.