Intel заявила, что её серверный ускоритель вычислений Ponte Vecchio до 2,5 раза быстрее NVIDIA A100

В рамках конференции HotChips 34 компания Intel поделились новыми деталями о готовящихся к выпуску серверных ускорителях вычислений Ponte Vecchio, у которых на одной подложке объединены 63 отдельных элемента (47 функциональных включая GPU). В частности, эксперты компании рассказали о максимальной пропускной способности и производительности ускорителя Ponte Vecchio в вычислениях с одинарной и двойной точностью.

Источник изображений: Intel

В составе Ponte Vecchio используются кристаллы, выполненные по трём разным техпроцессам: Intel 7 (10 нм Enhanced SuperFin), TSMC N7 (7 нм) и TSMC N5 (5 нм). Они объединены между собой с помощью новой упаковкой Foveros и шиной EMIB. В составе одного Ponte Vecchio присутствуют 128 графических ядер Xe, 128 ускорителей трассировки лучей, 64 Мбайт кеш-памяти L1 и 408 Мбайт кеш-памяти L2. Данные ускорители также получили до 128 Гбайт высокоскоростной памяти HBM2e и поддерживают интерфейс PCIe 5.0.

 Подсистема памяти и пропускная способность (ниже) Ponte Vecchio

Подсистема памяти и пропускная способность (ниже) Ponte Vecchio

 Ponte Vecchio в задачах DPC++ в сравнении с NVIDIA A100

Ponte Vecchio в задачах DPC++ в сравнении с NVIDIA A100

По словам Intel, в задачах Data Parallel C++ (DPC++) ускорители Ponte Vecchio обеспечивают в 1,4–2,5 раза более высокую производительность по сравнению с серверными ускорителями вычислений NVIDIA A100. Intel также предоставила данные о производительности своего решения в ExaSMR OpenMC (современный код Монте-Карло для исследований и разработок), где Ponte Vecchio обеспечивает вдвое более высокую производительность. А в NekRS (для решения уравнений Навье–Стокса) решение Intel показывает производительность в 1,3–1,7 раза выше конкурента.

 Ponte Vecchio в задачах ExaSMR и miniBUDE

Ponte Vecchio в задачах ExaSMR и miniBUDE

Ожидалось, что Intel Ponte Vecchio вместе с серверными процессорами Intel Sapphire Rapids Xeon дебютируют в составе первого американского эксафлопсного суперкомпьютера Aurora. Однако из-за задержки разработки это звание перехватил суперкомпьютер Frontier, оснащённый третьим поколением процессоров AMD EPYC и графическими ускорителями AMD Instinct MI250X, выдающими пиковую производительность в 1,6 Эфлопс.

 Источник изображения: VideoCardz

Источник изображения: VideoCardz

Когда состоится релиз Ponte Vecchio — пока неизвестно. Однако на его замену Intel уже готовит ускоритель Rialto Bridge.

Источник

Tags

Похожие статьи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Закрыть