Получи случайную криптовалюту за регистрацию!

Раскрыты подробности о графическом ядре NVIDIA Ada Lovelace, н | HEAD SHOT

Раскрыты подробности о графическом ядре NVIDIA Ada Lovelace, на котором будут основаны видеокарты серии GeForce RTX 4000

Информация об архитектуре графического процессора NVIDIA Ada Lovelace появилась не так давно, в конкретных конфигурациях будут задействованы чипы серии AD10* следующего поколения для видеокарт серии GeForce RTX 40 которые также просочились. Теперь можно поговорить исключительно о самом графическом чипе следующего поколения.

Сетевой детектив Kopte7kimi поделился деталями о блок-схеме архитектуры следующего поколения, он сравнивает топовый графический процессор AD102 с различными другими графическими процессорами NVIDIA.

А именно Ampere GA102 и Turing TU102, ориентированные на игры, в то время как в список добавлены Hopper GH100 и Ampere GA100, ориентированные на высокопроизводительные рабочие станции. В сравнении идёт AD102 только с его игровыми предшественниками, поскольку чипы, ориентированные на суперсистемы, сильно отличаются от предложений, ориентированных на потребителя.

Графический процессор NVIDIA Ada Lovelace AD102 будет иметь до 12 кластеров обработки графики (GPC). Это увеличение на 70% по сравнению с GA102, который имеет только 7 GPC. Каждый чип будет состоять из 6 TPCs и 2 SMS, которые идёт в той же конфигурацией, что и существующий чип. Каждый потоковый мультипроцессор (SM) будет содержать четыре подъядерных процессора, которые также совпадают с GPU GA102.

Что изменилось, так это конфигурация ядра FP32 и INT32. Каждое подъядерное ядро будет включать 128 блоков FP32, но комбинированные блоки FP32 + INT32 увеличенные до 192. Это потому, что блоки FP32 не имеют одного и того же подъядерного ядра, что и блоки IN32. Ядра 128 FP32 отделены от ядер 64 INT32.

Таким образом, в общей сложности каждое подъядерное ядро будет состоять из 128 FP32 плюс 64 INT32 единиц в общей сложности 192 единиц. Каждый SM будет иметь в общем 512 FP32 единиц плюс 256 INT32 единиц в общем 768 единиц. И поскольку существует в общей сложности 24 единицы SM (2 на GPC), получается на 12 288 единиц FP32 и 6 144 единицы INT32 для общего количества ядер 18 432. Каждый SM также будет включать две схемы обработки (32 потока / CLK) для 64 вычислений на SM. Это увеличение на 50% ядер (FP32 + INT32) и увеличение на 33% при ядрах / потоках по сравнению с GA102.

NVIDIA сделала большой прорыв в манипуляциях с кэшем по сравнению с существующими графическими процессорами Ampere. Ada Lovelace будут содержать 192 КБ кэша L1 на SM, что на 50% больше, чем Ampere. Это в общей сложности 4,5 МБ кэша L1 на топовом графическом процессоре AD102. Кэш L2 будет увеличен до 96 МБ, как упоминалось в утечках. Это 16-кратное увеличение по сравнению с графическим процессором Ampere, который содержит всего 6 МБ кэша L2 и он будет разделен между графическим процессором.

Также есть данные об элементах отвечающих за запись пикселей в память (ROPS), которые также увеличены до 32 на GPC, в 2 раза увеличенные по сравнению с Ampere. На флагмане следующего поколения будет до 384 ROPs против всего 112 на самом быстром графическом процессоре Ampere в Geforce RTX 3090 Ti.

Кроме того, на графических процессорах Ada Lovelace будут установлены новейшие ядра 4-го поколения Tensor и 3-го поколения RT (Raytracing), которые помогут повысить производительность DLSS и Raytracing до следующего уровня. В целом, графический процессор Ada Lovelace AD102 предложит:

2x GPCs против Ampere.
50% больше ядер по сравнению с Ampere.
50% больше кэша L1 по сравнению с Ampere.
16x больше кэша L2 по сравнению Ampere.
Удвоение ROPs против Ampere.
4-тое поколение Tensor и 3-е поколение ядер Raytracing.
Стоит упомянуть что тактовые частоты, которые, как говорят, находятся в диапазоне 2-3 ГГц, не учитываются в уравнении, поэтому они также будут играть важную роль в улучшении производительности на ядро по сравнению с Ampere.

Видеокарты серии NVIDIA GeForce RTX 4000 с игровыми графическими процессорами Ada Lovelace следующего поколения скорее всего будут выпущены во второй половине 2022 года на том же технологическом процессе TSMC 4N, что и Hopper H100.