SRAM, да и только: d-Matrix готовит ИИ-ускоритель Corsair

20.01.2025 07:53

«3DNews»

Стартап d-Matrix создал ИИ-ускоритель Corsair, оптимизированный для быстрого пакетного инференса больших языковых моделей (LLM). Архитектура ускорителя основана на модифицированных ячейках SRAM для вычислений в памяти (DIMC), работающих на скорости порядка 150 Тбайт/с. Новинка, по словам компании, отличается производительностью и энергоэффективностью, пишет EE Times. Массовое производство Corsair начнётся во II квартале. Среди инвесторов d-Matrix — Microsoft, Nautilus Venture Partners, Entrada Ventures и SK hynix. d-Matrix фокусируется на пакетном инференсе с низкой задержкой. В случае Llama3-8B сервер d-Matrix (16 четырёхчиплетных ускорителей в составе восьми карт) может производить 60 тыс. токенов/с с задержкой 1 мс/токен. Для Llama3-70B стойка d-Matrix (128 чипов) может производить 30 тыс. токенов в секунду с задержкой 2 мс/токен. Клиенты d-Matrix могут рассчитывать на достижение этих показателей для размеров пакетов порядка 48–64 (в зависимости от длины контекста), сообщила EE Times руководитель отдела продуктов d-Matrix Шри Ганесан (Sree Ganesan).

Moscow.media

Частные объявления сегодня

Rss.plus

Все новости за 24 часа

SRAM, да и только: d-Matrix готовит ИИ-ускоритель Corsair

Новости спорта

«Фонсека в матче с Рублёвым в Австралии сыграл просто великолепно и не дал Андрею вернуться» — Петрова

Дизайн и ремонт квартир под ключ с гарантией

Овчинский: В Троицке открылось 45 предприятий на первых этажах новостроек по реновации

Так кому надо извиняться? Как «черные ящики» лайнера AZAL «выдали» провокацию Алиева

В Крылатском пройдет концерт «Татьянин день» в центре московского долголетия