СИНЧУ, ТАЙВАНЬ — 16 СЕНТЯБРЯ: Крупный план кремниевой пластины на выставке Taiwan Semiconductor … [+]
Генеративный искусственный интеллект меняет будущее, в том числе геополитику, и кремниевые чипы, выгравированные на транзисторах, лежат в основе этого переворота. Но узкое место в производстве чипов, особенно в Nvidia, грозит замедлить внедрение ИИ. В ответ на это наблюдается шквал активности по разработке новых и лучших чипов.
Основатель OpenAI Сэм Альтман собирает миллиарды для создания сети заводов по производству чипов, Закон администрации Байдена о чипах и науке выделяет 52,7 миллиарда долларов на исследования чипов, а такие компании, как Тайваньская компания по производству полупроводников (TSMC) и Intel, инвестируют миллиарды в новые мощности в США. Государства. Эти разработки подчеркивают решающую роль чипов в стимулировании инноваций, экономической мощи и технологической независимости.
Бизнес-лидерам не нужны глубокие технические знания в области архитектуры микросхем, но понимание стратегических последствий достижений в области проектирования микросхем имеет важное значение. Помимо того, что лидеры могут идти в ногу с технологическими тенденциями, они могут использовать эти достижения для повышения операционной эффективности, обеспечения устойчивости цепочки поставок, стимулирования инноваций и сохранения конкурентоспособности в экономике, основанной на данных.
Спустя десятилетие после того, как в конце 1950-х годов транзисторы заменили электронные лампы в электронике, Fairchild Semiconductor начала упаковывать несколько транзисторов в один чип, положив начало закону Мура, который гласит, что количество транзисторов на двойном чипе увеличивается примерно каждые два года. Но с ослаблением закона Мура спрос на вычислительную мощность выше, чем когда-либо, из-за развития генеративного искусственного интеллекта и периферийных вычислений.
Сегодняшние производители микросхем выходят за рамки миниатюризации и разрабатывают специализированные чипы с новой архитектурой. Монолитный процессор, который долгое время доминировал в вычислительной технике, дополняется «ускорителями» — специализированными чипами, оптимизированными для конкретных рабочих нагрузок. Это эквивалент расширения двухполосной автомагистрали до шести полос, что позволяет транспортному потоку двигаться быстрее.
Оптимизированные для искусственного интеллекта ускорители, такие как графические процессоры (GPU), программируемые вентильные матрицы (FPGA), специализированные интегральные схемы (ASIC) и нейроморфные чипы, являются частью этой трансформации, каждый из которых предназначен для ускорения вычислений. одиночные задачи. Например, последние чипы Nvidia Blackwell и Rubin обеспечивают значительное повышение производительности при обучении моделей искусственного интеллекта, оптимизированных для таких рабочих нагрузок, как большие языковые модели.
Этот спрос на более эффективные ускорители спровоцировал гонку по созданию новых архитектур. Такие компании, как Cerebras, расширяют границы возможного, предлагая чипы, содержащие сотни тысяч процессоров, оптимизированных для искусственного интеллекта, на одной пластине. Между тем, высокоскоростной чип Groq использует большую встроенную память для повышения скорости вывода моделей искусственного интеллекта.
Поскольку Nvidia доминирует на рынке AI-чипов со своей платформой CUDA — платформой программирования для графических процессоров NVIDIA — появляются альтернативы. Например, UXL Foundation работает над бесплатными альтернативами CUDA, потенциально открывая рынок для большего количества вариантов оборудования. По мере того, как чипы сторонних производителей набирают обороты, более конкурентная среда, вероятно, ослабит ограничения по мощности и диверсифицирует поставки оборудования для искусственного интеллекта.
И не для каждой рабочей нагрузки ИИ требуется первоклассное оборудование. Скорее всего, мы увидим контейнеризацию рабочих нагрузок, при которой сложные задачи выполняются современными чипами, а более простые задачи выполняются на обычных процессорах. Такой подход оптимизирует ресурсы и производительность, балансируя традиционную и новую архитектуру для различных приложений ИИ.
Еще одно направление внимания — периферийные вычисления, где обработка данных происходит ближе к источнику, что снижает задержку и повышает безопасность. Такие приложения, как беспилотные транспортные средства и промышленная автоматизация, извлекают выгоду из моделей принятия решений в реальном времени. Такие компании, как Nvidia и Qualcomm, а также такие стартапы, как SiMa.ai, создают специализированные чипы для периферийных вычислений, максимизируя эффективность обработки данных вблизи точки их генерации.
Энергопотребление и ограничения памяти также являются критическими проблемами при проектировании чипов. Память с высокой пропускной способностью (HBM) и вычисления в памяти — это новые решения, которые помогают устранить узкие места в памяти, которые могут замедлить производительность ИИ. Такие лидеры, как Samsung и SK Hynix, расширяют границы инноваций в области памяти, чтобы достичь новых уровней производительности и эффективности.
Новые вычислительные парадигмы также не за горами. Например, чип TrueNorth от IBM имитирует импульсную природу нейронов и их связей, обрабатывая массивный параллелизм и разреженные данные с низким энергопотреблением. Такие нейроморфные чипы могут позволить интеллектуальным устройствам выполнять такие задачи, как распознавание образов, сенсорная обработка и принятие решений в реальном времени.
Поскольку ускорители стали более мощными, их физические корпуса также выросли. Пакет графических процессоров Nvidia H100 и Cerebras Wafer-Scale Engine являются примерами крупных и сложных конструкций, оптимизированных для расширенных потребностей в охлаждении и электропитании. Новые подходы, такие как проектирование наборов микросхем и 3D-стекирование, еще больше решают проблему замедления по закону Мура, позволяя нескольким меньшим чипам работать в унисон и повышая эффективность полупроводников.
Будущее вычислений движется к модульным системам, сочетающим центральные и графические процессоры, ускорители искусственного интеллекта и специализированные чипы. Стратегия Intel по интеграции ядер ЦП и графического процессора в единый пакет иллюстрирует этот сдвиг, объединяя различные вычислительные возможности для удовлетворения различных рабочих нагрузок ИИ. Этот модульный подход способствует гибкости и эффективности, гарантируя, что компании и страны, инвестирующие в эти технологии, останутся в авангарде инноваций.
Между тем, Китай, пострадавший от ограничений правительства США, которые не позволяют ему приобретать передовые чипы и оборудование для производства микросхем из-за границы, активно работает над новыми вычислительными архитектурами и парадигмами, чтобы компенсировать свои старые технологии чипов.
Инновации в разработке чипов — это больше, чем техническое достижение; это ключ к прогрессу во всех секторах и регионах. Гонка за устранением узких мест в аппаратном обеспечении подчеркивает стратегическую важность передовых кремниевых технологий.
Понимая возможности этих достижений, лидеры могут оптимизировать операции, защитить цепочки поставок и стимулировать инновации. В более широком масштабе страны, которые инвестируют в производство чипов и исследования, позиционируют себя на стыке технологической и экономической мощи, обеспечивая себе место в глобальной экономике искусственного интеллекта.