Процесс вычислительного проектирования в машиностроении часто начинается с проблемы или цели, за которой следует оценка литературы, ресурсов и систем, доступных для решения проблемы. Вместо этого лаборатория DeCoDE (Дизайн-вычисление и цифровая инженерия) Массачусетского технологического института исследует пределы возможного.
В сотрудничестве с Watson AI Lab MIT-IBM руководитель группы ABS, помощник по развитию карьеры профессор Фаез Ахмед и аспирант Амин Хейрани Нобари с факультета машиностроения сочетают методы машинного обучения и генеративный искусственный интеллект, физическое моделирование и инженерные принципы для решения задач проектирования и совершенствовать создание механических систем. Один из их проектов, Ссылкиизучает способы соединения плоских стержней и соединений для создания криволинейных путей. Здесь Ахмед и Нобари описывают свою недавнюю работу.
Вопрос : Как ваша команда планирует подходить к вопросам машиностроения с точки зрения наблюдений?
Ахмед: Вопрос, над которым мы подумали: как можно использовать генеративный ИИ в инженерных приложениях? Одной из основных задач является интеграция точности в генеративные модели искусственного интеллекта. Теперь, в конкретной работе, которую мы там изучали, мы используем идею контрастных подходов к обучению с самоконтролем, когда мы эффективно изучаем эти представления дизайна в виде связей и кривых или то, как выглядит дизайн. как и как это работает. .
Это тесно связано с идеей автоматизированного открытия: можем ли мы на самом деле открывать новые продукты с помощью алгоритмов ИИ? Еще один комментарий к более широкой картине: одна из ключевых идей, особенно в отношении ссылок, но в целом вокруг генеративного ИИ и больших языковых моделей — все они представляют собой одно и то же семейство моделей, которое есть у нас. Давайте посмотрим, и точность действительно играет важную роль. роль во всех из них. Таким образом, уроки, которые мы извлекаем из этих типов моделей, в той или иной форме обучения, основанного на данных, с помощью инженерных симуляторов и совместной интеграции дизайна и производительности, потенциально могут быть также перенесены в другие области инженерии. То, что мы показываем, является доказательством концепции. Тогда люди смогут взяться за это и спроектировать корабли и самолеты, решать конкретные проблемы создания изображений и так далее.
В случае ссылок ваш дизайн выглядит как набор полос и способов их соединения. Функционирование — это, по сути, путь, который они записывают по мере своего движения, и мы изучаем эти общие представления. Итак, это ваш главный вклад – кто-то придет и проследит путь – и вы пытаетесь создать механизм, который сможет его проследить. Это позволяет нам решать задачу гораздо точнее и быстрее, с в 28 раз меньшим количеством ошибок (более точным) и в 20 раз быстрее, чем предыдущие современные подходы.
Вопрос : Расскажите мне о методе ссылок и о его сравнении с другими аналогичными методами.
Нобари: Контрастное обучение происходит между механизмами, которые представлены в виде графов, поэтому по сути каждое соединение будет узлом в графе, и этот узел будет включать в себя определенные функции. Характеристиками являются положение, пространство и тип соединений, они могут быть фиксированными или свободными.
У нас есть архитектура, которая учитывает некоторые базовые строительные блоки, когда дело доходит до описания кинематики механизма, но по сути это нейронная сеть графов, которая вычисляет вложения для этих графов механизмов. Затем у нас есть другая модель, которая принимает эти кривые в качестве входных данных и создает для них интеграцию, и мы соединяем эти две разные модальности с помощью контрастного обучения.
Затем эта контрастирующая структура обучения, которую мы обучаем, используется для поиска новых механизмов, но мы, очевидно, также заботимся о точности. В дополнение ко всем выявленным механизмам-кандидатам у нас также есть дополнительный этап оптимизации, в ходе которого эти выявленные механизмы будут дополнительно оптимизированы, чтобы максимально приблизиться к этим целевым кривым.
Если у вас есть правильная комбинаторная часть и вы достаточно близки к тому месту, где вам нужно быть, чтобы достичь имеющейся целевой кривой, вы можете выполнить прямую оптимизацию на основе градиента и отрегулировать положение сустава, чтобы получить сверхточную производительность. Это очень важный аспект работы.
Это примеры букв алфавита, но их очень трудно достичь традиционными методами. Другие методы, основанные на машинном обучении, часто даже не способны на подобные вещи, потому что они обучаются только на четырех или шести тактах, которые являются очень маленькими механизмами. Но что нам удалось показать, так это то, что даже при относительно небольшом количестве стыков можно очень близко подойти к этим кривым.
До этого мы не знали, каковы пределы возможностей конструкции однозвенного механизма. Это очень трудный для понимания вопрос. Ты действительно можешь написать букву М, верно? Никто никогда этого не делал, а механизм настолько сложен и редок, что это все равно, что найти иголку в стоге сена. Но с помощью этого метода мы показываем, что это возможно.
Мы исследовали возможность использования коммерчески доступных генеративных моделей для графики. В целом модели с генеративными графами очень сложно обучать и, как правило, они не очень эффективны, особенно когда речь идет о смешивании непрерывных переменных, которые имеют очень высокую чувствительность к фактической кинематике механизма. В то же время у вас есть все эти разные способы комбинирования соединений и связей. Эти модели просто не могут генерировать эффективно.
Я думаю, что сложность проблемы наиболее очевидна, если посмотреть на то, как люди подходят к ней с помощью оптимизации. При оптимизации это становится смешанной нелинейной проблемой. Используя простые двухуровневые оптимизации или даже упрощая задачу, они, по сути, создают аппроксимации всех функций, поэтому для решения проблемы можно использовать смешанно-целочисленное коническое программирование. Комбинаторное пространство, объединенное с непрерывным пространством, настолько велико, что может достигать до семи суставов. Кроме того, создание механизма под конкретную задачу становится чрезвычайно сложным и занимает два дня. Если бы вы сделали это исчерпывающе, было бы очень сложно охватить все пространство дизайна. Здесь вы не сможете заняться глубоким обучением, не пытаясь быть немного умнее в том, как вы это делаете.
Современные подходы, основанные на глубоком обучении, используют обучение с подкреплением. Они — учитывая целевую кривую — начинают строить эти механизмы более или менее случайно, по сути, подход типа оптимизации Монте-Карло. Измерение состоит в прямом сравнении кривой, нарисованной механизмом, и целевых кривых, введенных в модель, и мы показываем, что наша модель работает в 28 раз лучше, чем эта. Наш подход занимает 75 секунд, а подход, основанный на обучении с подкреплением, — 45 минут. Подход к оптимизации: вы запускаете его более 24 часов, и он не сходится.
Я думаю, что мы достигли точки, когда у нас есть очень убедительное подтверждение концепции механизмов связывания. Это достаточно сложная проблема, и мы видим, что одних только традиционной оптимизации и традиционного глубокого обучения недостаточно.
Вопрос : Какова общая картина необходимости разработки таких методов, как связи, которые сделают возможным совместное проектирование человека и ИИ в будущем?
Ахмед: Самое очевидное — это конструкция машин и механических систем, это мы уже показали. Тем не менее, я думаю, что ключевым вкладом этой работы является то, что она представляет собой дискретное, непрерывное пространство, в котором мы учимся. Итак, если вы подумаете о том, какие ссылки существуют и как эти ссылки связаны друг с другом, вы получите дискретное пространство. Вы либо подключены, либо нет: 0 и 1, но там, где находится каждый узел, существует непрерывное пространство, которое может меняться — вы можете находиться где угодно в пространстве. Изучение этих дискретных и непрерывных пространств — чрезвычайно сложная задача. Большая часть машинного обучения, которое мы видим, например, в компьютерном зрении, является только непрерывным, или язык в основном дискретен. Я думаю, что, демонстрируя эту дискретную и непрерывную систему, ключевая идея распространяется на многие инженерные приложения: от метаматериалов до сложных сетей, других типов структур и многого другого.
Есть шаги, о которых мы сразу задумываемся, и естественный вопрос — это более сложные механические системы и больше физики, например, вы начинаете добавлять разные формы упругого поведения. Затем вы также можете подумать о различных типах компонентов. Мы также думаем о том, как точность можно интегрировать в большие языковые модели и перенести туда часть знаний. Мы думаем о том, чтобы сделать эти модели генеративными. Сейчас они в некотором смысле извлекают механизмы и затем оптимизируют их из набора данных, тогда как генеративные модели будут генерировать эти методы. Мы также исследуем такое сквозное обучение, при котором оптимизация не требуется.
Нобари: Есть несколько мест в машиностроении, где они используются, и есть очень распространенные применения систем для этого типа обратного кинематического синтеза, где это было бы полезно. На ум приходят, например, системы автомобильной подвески, в которых вам нужна определенная траектория движения всего механизма подвески. Обычно это моделируют в 2D с помощью планирующих моделей всего механизма подвески.
Я думаю, что следующим шагом, который в конечном итоге будет очень полезным, будет демонстрация той же или подобной структуры для других сложных задач, связанных с комбинаторными и непрерывными значениями.
Эти проблемы включают в себя одну из вещей, которую я изучал: конформные механизмы. Например, когда у вас есть механика непрерывных жестких связей – вместо этих дискретных связей – у вас будет распределение материалов и движение, и часть материала деформирует остальную часть материала, чтобы дать вам другой тип движения.
Что касается конформных механизмов, они используются во многих разных местах, иногда в прецизионных машинах для фиксации механизмов, где требуется, чтобы определенная часть удерживалась на месте с помощью механизма, который ее фиксирует, который может делать это последовательно и с большой точностью. высокая точность. Если бы вы могли автоматизировать многое из этого с помощью инфраструктуры такого типа, это было бы очень полезно.
Все это сложные проблемы, которые включают как комбинаторные переменные расчета, так и переменные непрерывного расчета. Я думаю, что мы очень близки к этому, и в конечном итоге это будет последний шаг.
Эта работа частично поддерживалась лабораторией MIT-IBM Watson AI Lab.