Представлена финишная версия микропроцессора Xeon Phi Knights Landing для HPC
Пару лет назад у Intel появились серьезные амбиции в сфере GPU, которые вылились в проект Larabee, после этого наработки и идеи были применены для создания вычислительных ускорителей Xeon Phi. Хотя когда-то Intel подразумевала сделать настольный GPU для конкуренции с видеокартами AMD и NVIDIA. В любом случае, на конференции International Supercomputing Conference 2016 во Франкфурте-на-Майне Intel, в конце концов, представила финишную версию вычислительных ускорителей Xeon Phi последнего поколения Knights Landing, нацеленных на высокопроизводительные вычисления (HPC).
Технически Xeon Phi Knights Landing представляют собой кристалл площадью 700 мм², который делается Intel по 14-нм техпроцессу FinFET. Важнейшей чертой архитектуры можно назвать 76 ядер Silvermont, хотя с уникальными ядрами данного поколения они имеют не настолько не мало общего – Intel занесла оптимизации, направленные на вычисления. Среди их – векторные блоки для поддержки AVX-512, более большие кэши и возможность через Hyper-Threading запускать до 4 потоков на ядро. 6 каналов памяти чипа позволяют подключать до 384 Гбайт ОЗУ DDR4.
Подсистема памяти у HPC Xeon Phi Knights Landing играет важную роль, пользователи могут работать с оперативной памятью, которая дает сравнимо маленькую пропускную способность (обычно 90-120 Гбайт/с), либо интегрированную на упаковку память MCDRAM от Micron. Последняя имеет емкость всего 16 Гбайт, зато пропускная способность составляет 500 Гбайт/с. Данная память может употребляться в так называемой плоской модели, формируя свой узел хранения данных для каждого ускорителя. Или память может работать в качестве кэша, наподобие памяти EDRAM, дополняющей некоторые iGPU Intel. Также имеется и гибридный режим между 2-мя вариациями.
Intel представляет четыре модели Xeon Phi Knights Landing. Лучший ускоритель будет доступен только в сентябре, поставки 3-х других уже начались. Что, кстати, видно по списку суперкомпьютеров Top 500. Осенью, а именно в октябре, HPC-ускоритель обзаведется опциональной поддержкой Omni Path, интерконнекта на базе оптического волокна. Данные модели будут дороже на $278 и будут потреблять на 15 Вт больше. К концу года также должны быть представлены варианты ускорителей в виде карт расширения PCI Express.
| Intel Xeon Phi Knights Landing | ||||||
|---|---|---|---|---|---|---|
| Модель | Ядра | Частота | MCDRAM | DDR4 | TDP | Стоимость |
| 7290 | 72 | 1,5 ГГц |
16 Гбайт 500 Гбайт/с |
384 Гбайт 2.400 МГц |
245 Вт | 6.254 долларов США |
| 7250 | 68 | 1,4 ГГц |
16 Гбайт 500 Гбайт/с |
384 Гбайт 2.400 МГц |
215 Вт | 4.876 долларов США |
| 7230 | 64 | 1,3 ГГц |
16 Гбайт 500 Гбайт/с |
384 Гбайт 2.400 МГц |
215 Вт | 3.710 долларов США |
| 7210 | 64 | 1,3 ГГц |
16 Гбайт 444 Гбайт/с |
384 Гбайт 2.133 МГц |
215 Вт | 2.438 долларов США |
Все варианты Xeon Phi Knights Landing инсталлируются в сокет LGA 3647, оснащаются 16 Гбайт памяти MCDRAM и могут адресовать до 384 Гбайт DDR4. У лучшей модели 7290 активированы 72 из 76 ядер, которые работают на 1,5 ГГц. 16 Гбайт памяти MCDRAM дают пропускную способность 500 Гбайт/с, энергопотребление составляет 245 Вт. Стоимость - $6.254. 2-ая модель в рейтинге 7250 предлагает 68 ядер на 1,4 ГГц. Энергопотребление снижено до 215 Вт, как и стоимость до $4.876. Большая пропускная способность памяти сохраняется и у 7230. 64 ядра работают на 1,3 ГГц, энергопотребление составляет 215 Вт. Стоимость - $3.710. На среднее соотношение стоимость/производительность нацелены ускорители 7210 с 64 ядрами на тактовой частоте 1,3 ГГц. Но тут память MCDRAM работает на 444,4 Гбайт/с, частота оперативки DDR4 также снижена до 2.133 МГц. Энергопотребление составляет 215 Вт, стоимость - $2.438.
Детали производительности Intel раскрыла только для самой резвой модели 7290. Производительность с одинарной точностью составляет 7 TFLOPS, с двойной – 3,5 TFLOPS. Для сопоставления, у NVIDIA Tesla P100, которая не так давно была представлена в варианте PCI Express, мы получаем 10,6 и 5,3 TFOPS в варианте NVLINK, также 9,3 и 4,7 TFLOPS в версии PCI Express. Энергопотребление составляет порядка 250 Вт. На теоретическом уровне новые Xeon Phi Knights Landing больше не зависят от host-процессора и могут без помощи других загружаться и делать программное обеспечение. Может быть, мы получим расширение диапазона функций HPC-ускорителей в не далеком будущем.
