Модель ИИ Института ARC EVO 2 разрабатывает генетический код во всех сферах жизни

Новости

«Сегодня мы можем для всех практических целей читать, записать и изменять любую последовательность ДНК, но мыNNOT СОКАЗАТЬ ЭТОПолем Возможно, мы можем разрезать и приклеить кусочки композиций природы, но мы не знаем, как писать стержни для одного ферментативного отрывка. Однако эволюция делает это. Фрэнсис Арнольд, доктор философии (чтение Нобелевской премии 2018)

Эво, Модель фонда генома, разработанная Институтом ARC Опубликовано в ноябре прошлого года который обобщен на языках биологии ДНК, РНК и белок для прогнозирующих и генеративных способностей получил крупное обновление.

В новой подготовке, которая еще не оценивается сверстниками и Опубликовано впервые на сайте ARCEvo 2 выходит за рамки одноклеточных геномов бактерий и археи, чтобы включить информацию от людей, растений и других более сложных одноклеточных и многоклеточных видов в эукариотическом поле жизни.

Исследования, полученные в результате модели, охватывают диверсифицированный спектр научных областей, включая открытие лекарств, сельского хозяйства, промышленных биотехнологий и материальных наук. Мультимодальная и многомасштабная работа-это сотрудничество с Nvidia, а также участники Университета Стэнфорда, Калифорнийского университета в Беркли и Калифорнийского университета в Сан-Франциско.

«Рецепт Life полностью присутствует в генетической информации, содержащейся в нашей ДНК»,-сказала Кимберли Пауэлл, вице-президент по здравоохранению в NVIDIAПолем «Мы ищем более глубокое понимание биологической сложности. Эволюция решила эту проблему за миллионы лет, и Evo 2 стремится извлечь уроки из этого знания. »» »

В области здравоохранения понимание того, какие варианты генов связаны с болезнью, является бесценным инструментом для терапии. Ранняя валидация evo 2 способностей показала, что модель может идентифицировать, как генетические мутации влияют на белок, РНК и физическую форму организмов. В тестах с вариантами BRCA1, геном, связанным с риском развития рака молочной железы и яичников, EVO 2 достигла точности более 90%, чтобы предсказать, какие мутации являются доброкачественными по сравнению с заболеванием.

ЧИТАТЬ  Персональный дизайн для дома: Bamba отмечает свое 60-летие специальным проектом

Патрик Хсу, доктор философии, соучредитель института и заместитель профессора биоинженерии в Калифорнийском университете в Беркли, сказал, что Evo 2 -единственная модель, которая может предсказать эффекты кодирования и некодирующих мутаций.

«Это вторая лучшая модель кодирования мутаций, но это передовая кран Альфамиссенс DeepMind не может отметить », — сказал Хсу.

HSU также назвал EVO 1 как «размытый образ уникальной жизни», потому что он был сформирован на корпусе из 300 миллиардов нуклеотидов, полученных из проколотических геномов. Команда «хотела быть гораздо более амбициозной» в этом сотрудничестве с Nvidia.

Evo 2 был построен на облачной платформе NVIDIA DGX и образуется на более чем 9,3 миллиардах нуклеотидов геномов более 128 000 видов через дерево жизни. По словам Дейва Берка, доктора философии, руководителя технологии Arc Institute, в модели используется новая архитектура под названием StripedHyena 2, которая была «почти в три раза быстрее, чем модели оптимизированных трансформаторов». Модель также имеет 40 миллиардов параметров и представляет собой шкалу, аналогичную нынешнему поколению крупных языков из Meta, DeepMind или OpenAI.

Evo 2 может одновременно обрабатывать последовательности ДНК до 1 миллиона нуклеотидов, что позволяет им понимать отношения между сторонами, отдаленными от генома. HSU сказал, что эта длинная продолжительность контекста разблокирует несколько молекулярных шкал, короткие органические молекулы, такие как ARNT или гены генов (например, Opera), в целых бактериальных геномах или эукариотических хромосомах.

Институт ARC и NVIDIA описывают EVO 2 как «крупнейшую модель ИИ, доступную для общественности для биологии на сегодняшний день». Evo 2 доступен для общественного использования на Платформа Nvidia Bionemo и как дружелюбный интерактивный интерфейс под названием Evo Designer. Кроме того, авторы создали свои учебные данные, его обучение и код вывода и модель веса открытый исходный кодПолем

Evo 2 образуется на более чем 9,3 миллиардах нуклеотидов более 128 000 геномов в трех областях жизни (визуализируется здесь как точки, собранные сходством). [Arc Institute]

Biology App Store

Понимание биологии как «языка» не является новой концепцией. АDvances в секвенировании генома позволили нам «прочитать» человеческий геном, в то время как изобретение технологии CRISPR расширило наш набор инструментов до «публикации» гена.

ЧИТАТЬ  Выставки в Москве: образ эпохи на выставке «Дневник красивой жизни»

В 2023 году HSU и Брайан Хи, доктор философии, доцент кафедры химической инженерии в Университете Стэнфорда, начали думать о разработке или «писательстве» биологических последовательностей, включая белки, начиная с фундаментального слоя самой ДНК. «В конце концов, сами белки кодируются непосредственно геномом», — сказал Хсу.

«Автоматическое обучение начало революционизировать биологию и модели, такие как Алфафолд Или Esmblop Предсказание и дизайн структуры активированных белков. Несмотря на эти достижения, сложность этих молекул омрачена общей сложностью всей клетки », — продолжал HSU.

Поскольку биологические функции не выполняются с помощью одной изолированной молекулы белка, построение синтетических геномов может обеспечить драгоценный инструмент исследования для изучения более широкого биологического контекста, эксплойта, который AVO 2 атакует головой.

» До сих пор много биологического дизайна сосредоточилась на молекулярном уровне, потому что это все, что мы могли бы контролировать. Если у нас есть мощная модель, которая позволяет нам генерировать полные организмы, то которая разблокирует множество нижестоящих задач [with a wide array of use cases]»Сказал Хи.

Pre -Impression Evo 2 описал три задачи дизайна, которые охватывают различные уровни геномной сложности: 1) митохондриальный геном 2) Прокариоте генома Микоплазма гениталииОбычно используемая модель минимального генома и 3) дрожжевой хромосомы, которая представляет эукариотические организмы.

Для трех задач проектирования подготовка показала доказательства, подтверждающие когерентность генома, такого как конструкция генов, которые кодируют для всех компонентов электронной транспортной цепи (как это обеспечивается Alphafold 3) в случае митохондриального генома и генома митохондриального и генома митохондриального Присутствие присутствия природных аналогов и более сложной геномной архитектуры, такой как интроны, в случае дрожжевой хромосомы.

Подготовка также представляла рабочий процесс для «генеративной эпигеномики», который разработал последовательности ДНК с желательной доступностью хроматина для имитации эукариотических генов.

ЧИТАТЬ  Tiny Studio 20 м² с атмосферой загородного дома - Inmyroom

Отвечая на вопрос об экспериментальных планах валидации, HIE сказал, что сотрудничество с крупными экспертами в синтезе ДНК и в сборке Университета Вашингтона ведется для того, чтобы вставить концепции доступности хроматина в клетках мыши для проверки.

В будущем Институт ARC заинтересован в том, чтобы полагаться на эту биологическую сложность, создавая виртуальную клетку.

«Узкое место, чтобы обнаружить лекарства, заключается в том, что мы не знаем, что заставляет эту болезнь начинать», — сказал Хи. «Если у нас есть очень компетентная модель генома, и мы разрезаем это с помощью информации об окружающей среде посредством секвенирования РНК, сети регуляции генов и сети сигналов клеток, этот комбинированный мультимодальный кадр мы позволяем ответить на эти фундаментальные вопросы о заболевании».

HIE рассматривает EVO 2 как «операционную систему» ​​или фундаментальный слой, который предоставляет платформу для большой генеративной функциональной геномики. Хотя Evo 2 «может не решать все вопросы в биологии», модель предлагает большую степень применимости по сравнению с предшественниками, специфичными для задач, такими как алфафолд для прогнозирования структуры белка.

«Мы хотим позволить исследовательскому сообществу полагаться на эти модели фундамента. Вот почему мы приложили столько усилий с NVIDIA, чтобы сделать этот источник полностью открытым », — взвешивал HSU. «Мы действительно с нетерпением ждем того, как ученые и инженеры полагаются на этот« магазин приложений »для биологии».

Фэй Лин, доктор философии, является редактором -in -chief для Gen BiotechnologyПолем



Source

Оцените статью
Своими руками