Биофизики Северо-Западного университета разработали новый вычислительный инструмент для определения комбинаций генов, лежащих в основе таких сложных заболеваний, как диабет, рак и астма. В отличие от нарушений, вызванных одним геном, эти состояния обусловлены сетью из нескольких генов, работающих вместе.
Но само число возможных комбинаций генов огромно, что делает для исследователей невероятно сложным определение конкретных из них, вызывающих заболевание.
Используя модель генеративного искусственного интеллекта (ИИ), новый метод усиливает ограниченные данные по экспрессии генов , позволяя исследователям определять закономерности активности генов, которые вызывают сложные признаки.
Эта информация может привести к новым и более эффективным методам лечения заболеваний, включающим молекулярные мишени, связанные с несколькими генами.
Исследование «Генеративное прогнозирование наборов причинных генов, ответственных за сложные признаки» опубликовано в Трудах Национальной академии наук.
«Многие заболевания определяются комбинацией генов, а не одним», — сказал Эдилсон Моттер из Северо-Западного университета, старший автор исследования.
«Такую болезнь, как рак, можно сравнить с авиакатастрофой. В большинстве случаев для того, чтобы самолет потерпел крушение, должно произойти несколько отказов, а различные комбинации отказов могут привести к схожим результатам.
Это усложняет задачу определения причин. Наша модель помогает упростить ситуацию, выявляя ключевых игроков и их коллективное влияние».
Эксперт по сложным системам , Моттер — профессор физики имени Чарльза Э. и Эммы Х. Моррисон в Северо-Западном колледже искусств и наук Вайнберга и директор Центра сетевой динамики.
Другие авторы исследования — все связаны с лабораторией Моттера — это научный сотрудник Бенджамин Кузнец-Спек, аспирант Будука Огонор и научный сотрудник Томас Вайток. Текущие методы не оправдывают ожиданий Десятилетиями исследователи пытались разгадать генетические основы сложных человеческих черт и болезней.
Даже неболезненные черты, такие как рост, интеллект и цвет волос, зависят от наборов генов.
Существующие методы, такие как исследования ассоциаций по всему геному , пытаются найти отдельные гены, связанные с признаком. Но им не хватает статистической мощности для обнаружения коллективных эффектов групп генов.
«Проект «Геном человека» показал нам, что у нас всего в шесть раз больше генов, чем у одноклеточной бактерии», — сказал Моттер.
«Но люди гораздо более сложны, чем бактерии, и одно лишь количество генов этого не объясняет. Это подчеркивает распространенность мультигенных отношений и то, что именно взаимодействия между генами приводят к возникновению сложной жизни».
«Определение отдельных генов по-прежнему ценно», — добавил Уайток. «Но существует лишь очень малая часть наблюдаемых признаков, или фенотипов, которые можно объяснить изменениями в отдельных генах.
Вместо этого мы знаем, что фенотипы являются результатом совместной работы многих генов. Таким образом, имеет смысл, что несколько генов обычно способствуют изменению признака».
Не гены, а экспрессия генов Чтобы помочь преодолеть давний разрыв в знаниях между генетическим строением (генотипом) и наблюдаемыми признаками (фенотипом), исследовательская группа разработала сложный подход, сочетающий машинное обучение с оптимизацией.
Модель, получившая название Transcriptome-Wide conditional Variational auto-Encoder (TWAVE), использует генеративный ИИ для выявления закономерностей из ограниченных данных по экспрессии генов у людей.
Соответственно, она может эмулировать болезненные и здоровые состояния, чтобы изменения в экспрессии генов можно было сопоставить с изменениями в фенотипе.
Вместо того, чтобы изучать эффекты отдельных генов изолированно, модель определяет группы генов, которые в совокупности вызывают появление сложного признака.
Затем метод использует структуру оптимизации для определения конкретных изменений генов, которые с наибольшей вероятностью изменят состояние клетки со здорового на больное или наоборот.
«Мы смотрим не на последовательность генов, а на экспрессию генов», — сказал Вайток.
«Мы обучили нашу модель на данных клинических испытаний, поэтому мы знаем, какие профили экспрессии являются здоровыми или больными. Для меньшего числа генов у нас также есть экспериментальные данные , которые говорят о том, как сеть реагирует, когда ген включается или выключается, и мы можем сопоставить их с данными по экспрессии, чтобы найти гены, вовлеченные в заболевание».
Сосредоточение на экспрессии генов имеет множество преимуществ.
Во-первых, это обходит проблемы конфиденциальности пациента. Генетические данные — фактическая последовательность ДНК человека — изначально уникальны для каждого человека, предоставляя сугубо личный план здоровья, генетических предрасположенностей и семейных отношений.
Данные об экспрессии, с другой стороны, больше похожи на динамический снимок клеточной активности.
Во-вторых, данные об экспрессии генов неявно учитывают факторы окружающей среды , которые могут включать или выключать гены для выполнения различных функций.
«Факторы окружающей среды могут не влиять на ДНК, но они определенно влияют на экспрессию генов», — сказал Моттер. «Таким образом, наша модель имеет преимущество в том, что косвенно учитывает факторы окружающей среды».
Путь к персонализированному лечению Чтобы продемонстрировать эффективность TWAVE, команда протестировала его на нескольких сложных заболеваниях.
Метод успешно идентифицировал гены (некоторые из которых были пропущены существующими методами), вызывающие эти заболевания. TWAVE также показал, что разные наборы генов могут вызывать одно и то же сложное заболевание у разных людей.
Это открытие предполагает, что персонализированные методы лечения могут быть адаптированы к конкретным генетическим факторам заболевания пациента.
«Болезнь может проявляться одинаково у двух разных людей», — сказал Моттер. «Но, в принципе, у каждого человека может быть задействован разный набор генов из-за генетических, экологических и образ жизни различий.
Эта информация может сориентировать персонализированное лечение».
Рубрика: Наука и Hi-Tech. Читать весь текст на android-robot.com.