Добавить новость
ru24.net
Все новости
Август
2024

NVIDIA Blackwell: новые форматы данных обеспечивают большую производительность ядер Tensor

0

В преддверии HotChips 2024 компания NVIDIA уже рассказывала об инфраструктуре Blackwell в виде интерконнекта NVLink и соответствующих коммутаторов . На самой конференции NVIDIA рассказала немного больше об архитектуре Blackwell и встроенных в нее ядрах Tensor. Хотя они по-прежнему могут вычислять большие матрицы за один прогон, благодаря новым форматам данных значительно увеличили пропускную способность.

С помощью новой системы квантования NVIDIA намерена значительно увеличить производительность инференса при работе с большими моделями. Квантование – это тип сжатия модели. Для сопоставимой плотности информации (например, качества изображения, созданного ИИ) теперь требуется меньше данных, что естественным образом ускоряет процесс инференса. По этой причине в последние месяцы производители программного и аппаратного обеспечения стараются использовать такие форматы данных, как INT8, FP8 и даже более простые форматы, такие как FP4 и INT4. До сих пор преимущество в производительности было ограниченным, поскольку для вычислений в INT4 или FP4 ...




Moscow.media
Частные объявления сегодня





Rss.plus




Спорт в России и мире

Новости спорта


Новости тенниса
Australian Open

«Я слишком стара, но иду дальше». Списанная русская теннисистка покоряет Австралию и готова мстить за Мирру






Опубликован список адресов в Туле, где 21 января отключат электричество

Мэрия Томска скорректирует планы благоустройства из-за нехватки 45млн

«Швабе» совместно с российскими вузами готовит сотни специалистов для российской промышленности

ДИТ Москвы: чем полезен столичный портал потребителя