На мероприятии GTC 2024 компания Nvidia представила свой новейший ИИ-процессор, построенный на архитектуре Blackwell. Это впечатляющее решение следующего поколения обещает значительно улучшенную производительность и энергоэффективность по сравнению с предыдущими моделями, такими как Hooper.
Вот некоторые ключевые характеристики архитектуры Nvidia Blackwell:
- Два кристалла, изготовленных по технологии TSMC 4NP по 4-нм техпроцессу.
- Общее количество транзисторов составляет 208 миллиардов.
- Внедрены новые тензорные ядра.
- Используется шина NV-HBI для связи кристаллов с пропускной способностью 10 ТБ/с.
- Восемь слоев памяти HBM3E объемом 192 ГБ.
- Ширина шины памяти составляет 8192 бита, а пропускная способность – 8 ТБ/с.
- Поддержка интерфейса NVLink пятого поколения для объединения нескольких ускорителей в одной системе с пропускной способностью 1,8 ТБ/с в обоих направлениях.
- NVLink позволяет объединить до 576 GPU в одной системе.
- Тепловой дизайн процессора составляет до 1000 Вт.
- Производительность в операциях FP4 достигает 20 PFLOPS.
Представители Nvidia отмечают, что для обучения модели искусственного интеллекта с 1,8 трлн параметров требуется всего 2000 графических процессоров Blackwell и 4 МВт энергии, в то время как для аналогичной задачи с использованием графических процессоров Hopper требуется 8000 единиц и 15 МВт энергии.
Одним из флагманских решений компании станет Nvidia GB200 Grace Blackwell Superchip, объединяющий два новых GPU и ARM-процессор Grace с 72 ядрами Neoverse V2. Такая система обеспечит производительность на уровне 40 PFLOPS в операциях FP4.