Как редкие генетические варианты могут влиять на здоровье? Искусственный интеллект способен делать более точные прогнозы.

Предрасположенность к различным заболеваниям во многом определяется миллионами вариантов нашего генома. Однако, особенно когда речь идет о генетических вариантах, которые редко встречаются в популяции, их влияние на проявление определенных патологических признаков до сих пор остается загадкой.

Исследователи из Немецкого онкологического исследовательского центра (DKFZ), Европейской лаборатории молекулярной биологии (EMBL) и Мюнхенского технического университета (Technical University of Munich) разработали алгоритм, основанный на глубоком обучении, который способен предсказывать последствия редких генетических вариантов.

Статья опубликована в научном журнале Nature Medicine. Этот метод позволяет более точно выявлять лиц с высоким риском заболевания и упрощает процесс обнаружения генов, участвующих в развитии болезней.

Геном каждого человека уникален и отличается от геномов других людей миллионами отдельных строительных блоков, известных как варианты. Многие из этих вариантов связаны с различными биологическими особенностями и заболеваниями. Подобные корреляции обычно выявляются в ходе полногеномных ассоциативных исследований.

Однако влияние редких вариантов, которые встречаются в популяции с частотой всего 0,1% или менее, часто остается незамеченным в таких исследованиях.

«Редкие варианты зачастую оказывают значительное влияние на проявление биологического признака или заболевания», — говорит Брайан Кларк (Brian Clarke), один из первых авторов данного исследования. «Поэтому они могут помочь нам идентифицировать гены, участвующие в развитии болезни, что, в свою очередь, укажет нам путь к новым терапевтическим подходам», — добавляет соавтор Ева Холткамп (Eva Holtkamp).

Чтобы лучше прогнозировать последствия редких вариантов, команды под руководством Оливера Стегла (Oliver Stegle) и Брайана Кларка из DKFZ и EMBL, а также Жюльена Ганьера (Julien Gagneur) из Технического университета Мюнхена разработали инструмент оценки рисков, основанный на машинном обучении. Этот метод, получивший название «DeepRVAT» (тестирование ассоциаций редких вариантов), стал первым, в котором искусственный интеллект (ИИ) применяется в исследованиях геномных ассоциаций для расшифровки редких генетических вариантов.

Первоначально модель была обучена на данных о последовательностях (последовательностях экзома) 161 000 человек из Британского биобанка. Исследователи также предоставили информацию о генетически обусловленных биологических чертах отдельных людей и о генах, участвующих в этих чертах.

Последовательности, использованные для обучения, включали около 13 миллионов вариантов. Для каждого из них были доступны подробные «аннотации», предоставляющие количественную информацию о возможных эффектах, которые данный вариант может оказывать на клеточные процессы или структуру белка. Эти аннотации стали ключевым компонентом обучения.

После обучения DeepRVAT способен предсказать для каждого человека, какие гены нарушают свою функцию из-за редких вариантов. Для этого алгоритм использует отдельные варианты и их аннотации для расчета числового значения, описывающего степень нарушения гена и его потенциальное влияние на здоровье.

Исследователи проверили DeepRVAT на данных генома из Британского биобанка. Для 34 проверенных признаков, то есть результатов анализа крови, связанных с заболеванием, метод тестирования обнаружил 352 ассоциации с вовлеченными генами, что значительно превосходит все ранее существовавшие модели. Результаты, полученные с помощью DeepRVAT, оказались очень надежными и лучше воспроизводимыми на независимых данных, чем результаты альтернативных подходов.

Еще одним важным применением DeepRVAT является оценка генетической предрасположенности к определенным заболеваниям. Исследователи объединили DeepRVAT с полигенной оценкой риска, основанной на более распространенных генетических вариантах. Это значительно повысило точность прогнозов, особенно для вариантов высокого риска.

Кроме того, DeepRVAT распознает генетические корреляции для множества заболеваний, включая различные сердечно-сосудистые заболевания, виды рака, метаболические и неврологические заболевания, которые не были обнаружены с помощью существующих тестов.

«DeepRVAT обладает огромным потенциалом для значительного развития персонализированной медицины. Наш метод работает независимо от типа признака и может гибко сочетаться с другими методами тестирования», — говорит физик и специалист по данным Оливер Стегл.

Теперь его команда стремится как можно скорее продолжить тестирование инструмента оценки риска в крупномасштабных испытаниях и внедрить его в практику.

DeepRVAT может помочь раскрыть генетическую основу некоторых видов детского рака.

«Меня восхищает потенциальное влияние DeepRVAT на применение редких заболеваний. Одной из главных проблем в исследованиях редких заболеваний является отсутствие крупномасштабных систематических данных. Используя возможности ИИ и полмиллиона экзомов в Британском биобанке, мы объективно определили, какие генетические варианты наиболее существенно нарушают функцию генов», — говорит Жюльен Ганьер из Технического университета Мюнхена.

Следующим шагом является интеграция DeepRVAT в инфраструктуру Немецкого архива генома и фенома человека (GHGA), что значительно упростит его применение в диагностике и фундаментальных исследованиях.

Еще одним преимуществом DeepRVAT является то, что этот метод требует значительно меньше вычислительной мощности, чем сопоставимые модели. DeepRVAT доступен в виде удобного программного пакета, который можно использовать либо с предварительно обученными моделями оценки рисков, либо обучать на собственных наборах данных исследователей для специализированных целей.

Литература:
Integration of Variant annotations using deep set networks boosts rare variant testing, Nature Medicine (2024). DOI: 10.1038/s41588-024-01919-z. www.nature.com/articles/s41588-024-01919-z