Согласно отчету Nvidia, компания рассматривает возможность принятия дизайна сокета, по крайней мере, для некоторых из своих будущих графических процессоров Blackwell B300 для приложений искусственного интеллекта и высокопроизводительных вычислений. Сила тренда кто цитирует Ежедневные экономические новости И ДеньгиDJ. Сообщается, что компания внедряет новый дизайн сокета для чего-то под кодовым названием GB300, и пока информация не выглядит, мягко говоря, убедительной. Тем не менее, учитывая, что идут дискуссии о цепочке поставок, об этом, по крайней мере, стоит задуматься.
MoneyDJ сообщает, что, учитывая частоту отказов графических процессоров AI при высоких нагрузках, затраты на замену материнских плат и проблемы с охлаждением, Nvidia и другие разработчики графических процессоров AI могут рассмотреть возможность использования конструкций сокетов для своих графических процессоров следующего поколения вместо пайки графических процессоров к материнским платам.
EDN цитирует аналитика CLSA Чэня Шуовэня, который сказал, что, основываясь на контроле над цепочкой поставок, Nvidia разрабатывает разъемы для графических процессоров для своих продуктов, возможно, начиная с GB200 Ultra. Сообщается, что Чен упомянул четырехпроцессорную конструкцию графического процессора Nvidia с процессором Nvidia. Ни в одном из отчетов не упоминается нечто под названием GB300, поэтому TrendForce добавила эту часть, возможно, на основе дополнительных обсуждений.
Следует отметить несколько элементов, касающихся отчетности. Конструкция разъемов скорее усугубит проблемы с питанием и охлаждением, чем поможет их решить, поэтому первый отчет неточен. Наиболее энергоемкие графические процессоры обычно используют корпус BGA.
4-процессорный графический процессор Blackwell с материнской платой ЦП не выглядит чем-то необычным, учитывая, что на серверах DGX мы видим 8-процессорную материнскую плату графического процессора и 2-процессорную материнскую плату ЦП, но такой дизайн выглядит потрясающе.
Номенклатура центров обработки данных Nvidia разделяет платформы графических процессоров компании (A100, H100, B100/B200) и Grace CPU + GPU (GH100, GB200). В настоящее время платформы GB200 используют корпус BGA для ЦП и ГП; Мы не уверены, нужно ли что-то менять с обновлением B200 Ultra, особенно с возможным обновлением GB200 Ultra во второй половине года.
Мы все любим стандартные процессорные разъемы за их простоту ремонта и возможности расширения. Но на серверах они занимают больше места и имеют больше энергетических и тепловых ограничений, чем пакеты BGA или модули SXM/OAM. Хотя модули поддаются ремонту, процесс может различаться в зависимости от конкретной конструкции материнской платы, а удаление модуля OAM/SXM требует осторожного обращения, поэтому они не так хороши, как разъемы.
Есть еще один момент. Карты расширения, модули SXM и OAM сложны и дороги в производстве, и на данный момент большинство модулей Nvidia SXM производятся компанией Foxconn. Переход с карты или модуля на сокет снижает затраты, но ограничивает производительность.
Возможности оборудования Blackwell
Прежде чем мы перейдем к так называемому продукту для центров обработки данных на базе Blackwell (GB300, GB200 Ultra и т. д.) с графическим процессором, давайте вспомним, какие графические процессоры для центров обработки данных на базе Blackwell уже представила Nvidia.
В настоящее время Nvidia официально представила свой графический процессор B200 (1000 Вт+), который будет использоваться на картах GB200 (под кодовым названием Bianca с одним процессором Grace и двумя графическими процессорами Blackwell, а также Ariel с одним процессором Ariel и одним графическим процессором Blackwell) и будет поставляться в форме BGA. фактор. Кроме того, у Nvidia также есть карты графического процессора Umbriel, поддерживающие восемь форм-факторов модулей SXM B200 (1000 Вт) и B100 (700 Вт). Кроме того, существуют платформы под кодовым названием Miranda (повышает производительность (думаю, более высокий TDP), сетевые возможности PCIe 6.0 и 800G) и под кодовым названием Oberon GB200, согласно данным Полуанализ.
Хотя существуют карты расширения Nvidia H100 и даже H200 (на основе архитектуры Hopper) с пониженной производительностью, чтобы соответствовать типичному энергопотреблению и тепловому бюджету, обеспечиваемым типичными серверами, Nvidia никогда не анонсировала какие-либо карты расширения с графическими процессорами на базе Blackwell.
Тем не менее, исходя из неофициальной информации, мы знаем, что Nvidia готовит свой продукт под кодовым названием B200A на базе монолитного процессора B102 с четырьмя стеками памяти HBM3E, соединенными с помощью упаковочной технологии TSMC CoWoS-S. Это контрастирует с двухчиповыми конструкциями B100/B200, которые упакованы с использованием CoWoS-L TSMC, а затем подключаются к восьми стекам памяти HBM3E.
Учитывая, что с предполагаемым B200A мы имеем дело с однокристальным продуктом, который не предназначен для того, чтобы стать рекордсменом по производительности, он может иметь несколько форм-факторов. Сюда входит модульная конструкция SXM (особенно в ее китайской форме B20) и форм-фактор карты расширения. Может ли это быть подвохом? Может быть. Посмотрим на это. Intel выпустила процессор Xeon Max 9480 «Sapphire Rapids» на базе сокета со встроенным HBM, но он не имел успеха за пределами некоторых суперкомпьютерных аудиторий. Хочет ли Nvidia создать что-то подобное? Посмотрим на это.