Устойчивый дизайн: инновации для повышения энергоэффективности с помощью искусственного интеллекта, часть 1 | Блог Microsoft Cloud

Узнайте больше о том, как мы добиваемся прогресса в выполнении наших обязательств в области устойчивого развития, из серии блогов Sustainable by design, начиная с Устойчивый дизайн: продвижение устойчивости ИИ.

Ранее этим летом моя коллега Ноэль Уолш опубликовала блог, в котором подробно описывала, как мы работаем над экономией воды в наших центрах обработки данных: Устойчивое развитие по замыслу: повышение эффективности использования воды в центрах обработки данных в рамках нашей приверженности нашим целям устойчивого развития: стать углеродоотрицательными и водоположительными. , нулевые отходы и защита биоразнообразия.

В Microsoft мы проектируем, создаем и эксплуатируем инфраструктуру облачных вычислений, охватывающую весь стек: от центров обработки данных до серверов и индивидуальных микросхем. Это создает уникальные возможности для организации совместной работы элементов для повышения производительности и эффективности. Мы рассматриваем работу по оптимизации энергопотребления и энергоэффективности как важный путь к выполнению нашего обязательства по снижению выбросов углекислого газа к 2030 году, наряду с нашей работой по продвижению безуглеродной электроэнергии и удалению углерода.

Быстрый рост спроса на инновации в области искусственного интеллекта, которые обеспечат новые горизонты открытий, дал нам возможность переосмыслить наши Инфраструктурные системыот центров обработки данных до серверов и микросхем, при этом эффективность и устойчивость находятся на переднем плане. Помимо поиска безуглеродной электроэнергии, мы внедряем инновации на всех уровнях стека, чтобы снизить энергоемкость и требования к мощности облачных вычислений и рабочих нагрузок искусственного интеллекта. Еще до того, как электроны попадут в наши центры обработки данных, наши команды сосредоточены на том, как мы можем максимизировать вычислительную мощность, которую мы можем генерировать из каждого киловатт-часа (кВтч) электрической энергии.

ЧИТАТЬ  Alaska Airlines объявляет об инвестициях в JetZero для развития инновационных авиационных технологий и дизайна - Новости Alaska Airlines

В этом блоге я хотел бы поделиться некоторыми примерами того, как мы повышаем мощность и энергоэффективность ИИ. Сюда входит системный подход к повышению эффективности и применение ИИ, в частности машинного обучения, для управления облачными и ИИ-рабочими нагрузками.

Повышение эффективности от центров обработки данных до серверов и микросхем

Оптимизация использования оборудования посредством интеллектуального управления рабочей нагрузкой

Верные своим корням как компании-разработчика программного обеспечения, это один из способов повышения энергоэффективности внутри компании. наши дата-центры Автоматизация процессов обеспечивается программным обеспечением, которое позволяет планировать рабочую нагрузку в режиме реального времени, чтобы максимально использовать существующее оборудование для удовлетворения спроса на облачные услуги. Например, мы можем наблюдать рост спроса, когда люди начинают свой рабочий день в одной части мира, и снижение спроса в остальных частях мира, когда другие отдыхают вечером. Во многих случаях мы можем согласовать доступность с потребностями внутренних ресурсов, например, выполнять рабочие нагрузки по обучению ИИ в непиковые часы, используя существующее оборудование, которое в противном случае простаивало бы в это время. Это также помогает нам улучшить использование энергии.

Мы используем возможности программного обеспечения для повышения энергоэффективности на каждом уровне инфраструктуры: от центров обработки данных до серверов и полупроводников.

Исторически сложилось так, что выполнение рабочих нагрузок искусственного интеллекта и облачных вычислений в отрасли основывалось на распределении центральных процессоров (ЦП), графических процессоров (ГП) и мощности сервера для каждой команды или рабочей нагрузки, что обеспечивало загрузку ЦП и графического процессора примерно на 50–60%. В результате некоторые процессоры и графические процессоры остаются с недостаточно используемой мощностью, потенциальной мощностью, которую в идеале можно было бы использовать для других рабочих нагрузок. Чтобы решить проблему использования и улучшить управление рабочей нагрузкой, мы переместили рабочие нагрузки Microsoft по обучению искусственному интеллекту в единый пул, управляемый технологией машинного обучения под названием Project Forge.

ЧИТАТЬ  Новое здание медицинской школы получило награды за дизайн и строительство
приложение
Глобальный планировщик Project Forge использует машинное обучение для виртуального планирования рабочих нагрузок обучения и вывода, чтобы они могли выполняться в периоды, когда оборудование имеет свободную мощность, что повышает коэффициент использования пропускной способности на 80–90 % в больших масштабах.

В настоящее время это программное обеспечение находится в разработке в службах Microsoft и использует искусственный интеллект для виртуального планирования тренировок и рабочих нагрузок, а также прозрачную контрольную точку, которая записывает снимок текущего состояния приложения или проекта в виде шаблона, чтобы его можно было приостановить и перезапустить в любой момент. время. Независимо от того, работает ли он на партнерском или специальном процессоре Microsoft, например Майя 100Project Forge последовательно повышал эффективность использования Azure до 80–90 % при масштабировании.

Безопасно собирайте неиспользуемую энергию в наших центрах обработки данных

Еще один способ повышения энергоэффективности — разумное распределение рабочих нагрузок в центре обработки данных для безопасного восстановления всей неиспользованной энергии. Сбор энергии относится к практикам, которые позволяют нам максимально использовать доступную энергию. Например, если рабочая нагрузка не потребляет всю выделенную ей энергию, эта избыточная энергия может быть заимствована или даже перераспределена на другие рабочие нагрузки. С 2020 года в результате этой работы было восстановлено около 800 мегаватт (МВт) электроэнергии из существующих центров обработки данных, чего достаточно для обеспечения электромобилем пробега около 4,5 миллионов миль.1

За последний год, несмотря на то, что рабочие нагрузки клиентов на ИИ возросли, наши темпы улучшения энергосбережения удвоились. Мы продолжаем внедрять эти передовые методы во всем парке наших центров обработки данных, чтобы восстанавливать и перераспределять неиспользованную энергию без ущерба для производительности и надежности.

Повышение эффективности ИТ-оборудования с помощью жидкостного охлаждения

Помимо управления питанием рабочих нагрузок, мы работаем над снижением требований к энергии и воде для охлаждения чипов и серверов, на которых они размещены. Мощная обработка современных рабочих нагрузок искусственного интеллекта приводит к увеличению выделения тепла, а использование серверов с жидкостным охлаждением значительно снижает потребление электроэнергии, необходимой для управления температурным режимом, по сравнению с серверами с воздушным охлаждением. Переход на жидкостное охлаждение также позволяет нам повысить производительность нашего кремния, поскольку чипы работают более эффективно в оптимальном температурном диапазоне.

ЧИТАТЬ  Отказ от логотипа Меган Маркл открывает блестящие возможности для дизайна

Одна из основных технических проблем, с которыми мы столкнулись при развертывании этих решений, заключалась в том, как модернизировать существующие центры обработки данных, предназначенные для серверов с воздушным охлаждением, с учетом последних достижений в области жидкостного охлаждения. персонализированные решения, такие как «помощник», компонент, который устанавливается рядом с серверной стойкой и обеспечивает циркуляцию жидкости, как в автомобильном радиаторе. Мы внедряем решения жидкостного охлаждения в существующие центры обработки данных, сокращая энергию, необходимую для охлаждения, и одновременно увеличивая плотность стоек. Это, в свою очередь, увеличивает вычислительную мощность, которую мы можем генерировать с каждого квадратного фута в наших центрах обработки данных.

Узнайте больше и изучите ресурсы для повышения эффективности облака и искусственного интеллекта.

Оставайтесь с нами, чтобы узнать больше по этой теме, в том числе о том, как мы работаем над переносом многообещающих исследований эффективности из лабораторий в бизнес-операции. Вы также можете узнать больше о том, как мы продвигаем устойчивое развитие, из нашей серии блогов «Устойчивое развитие благодаря дизайну», начиная с Устойчивый дизайн: продвижение устойчивости ИИ и устойчивый по своей конструкции: повышение эффективности использования воды в центрах обработки данных.

Архитекторам, основным разработчикам и лицам, принимающим решения в сфере ИТ, которые хотят больше узнать об эффективности облака и искусственного интеллекта, мы рекомендуем изучить Руководство по устойчивому развитию в Azure Well-Architected Framework. Этот комплект документации соответствует принципам проектирования Фонд зеленого программного обеспечения и призван помочь клиентам планировать и соблюдать меняющиеся требования и правила устойчивого развития, касающиеся разработки, развертывания и эксплуатации ИТ-возможностей.


1Допущения об эквивалентности основаны на оценках того, что электромобиль может проехать в среднем примерно 3,5 мили на киловатт-час (кВтч) x 1 час x 800.

Source

Оцените статью
Своими руками