Nvidia представила "суперплатформу" для обучения больших моделей ИИ
Платформа DGX Superpod будет состоять из множества систем DGX GB200. В каждой из них 36 «суперчипов» Nvidia GB200, состоящих из 36 графических процессоров Grace и 72 графических процессоров Blackwell. Этот суперкомпьютер обеспечит 240 Тбайт памяти, необходимой для работы больших языковых моделей. Плюс 11,5 эксафлопс вычислительной мощности.
Передовым DGX Superpod делает то, что платформа позволяет соединить множество систем GB200 с помощью анонсированной сетевой технологии Nvidia Quantum-X800 InfiniBand, https://venturebeat.com/ai/nvidias-new-dgx-superpod-can-hand... Venture Beat. Эта архитектура обеспечивает до 1800 Гбайт/с для каждого графического процессора в платформе. А новый протокол SHARP повышает эффективность архитектуры в четыре раза по сравнению с предыдущим поколением.
Прежде обучение модели с 1,8 трлн параметров требовало 8000 графических процессоров Hopper и 15 МВт энергии. А теперь, как утверждает компания, справятся 2000 процессоров Blackwell за 4 МВт.
Возможности систем DGX будут также доступны в облачном сервисе Nvidia DGX и партнеров: AWS, Google Cloud и Oracle Cloud.
По https://hightech.plus/2024/02/27/glava-nvidia-ii-zaberet-u-p... главы Nvidia, программирование в скором времени перестанет быть ценным навыком. Задачами по программированию, по мнению Хуанга, займется искусственный интеллект, поэтому для молодежи перспективнее получать знания в области биологии или сельского хозяйства. А кодить, при необходимости, можно будет на естественном языке с помощью ИИ.