Искусственный интеллект обнаружил новые гены, ответственные за развитие рака

Группа исследователей из Берлина объединила самые разнообразные данные и проанализировала их с помощью искусственного интеллекта и выявила множество “раковых генов”. Новый алгоритм поможет спрогнозировать, какие гены вызывают рак, даже если их последовательность ДНК не изменена. Это открывает новые перспективы для таргетной терапии и ранней диагностики рака. Результаты исследования опубликованы в научном журнале Nature Machine Intelligence.

Актуальность проблемы

При раке клетки выходят из-под контроля. Они размножаются и проникают в ткани, разрушая органы и тем самым нарушая жизненно важные функции. Этот неограниченный рост обычно индуцируется накоплением изменений ДНК в “раковых генах” — то есть мутаций в этих генах, которые управляют развитием клетки. Но некоторые виды рака имеют очень мало мутировавших генов, а это значит, что в этих случаях к заболеванию приводят другие причины.

Материалы и методы исследования

Группа исследователей разработала новый алгоритм с использованием технологии машинного обучения для идентификации 165 ранее неизвестных раковых генов. Последовательности этих генов не обязательно изменяются — по-видимому, уже нарушение регуляции этих генов может привести к раку. Все недавно идентифицированные гены тесно взаимодействуют с хорошо известными генами рака и, как было показано, имеют важное значение для выживания опухолевых клеток в экспериментах по культивированию клеток.

Алгоритм, получивший название «EMOGI», может также объяснить отношения в механизме клетки, которые делают геном рака. Как описывают исследователи во главе с Аннализой Марсико (Annalisa Marsico), программное обеспечение объединяет десятки тысяч наборов данных, полученных из образцов пациентов. Они содержат информацию о метилировании ДНК, активности отдельных генов и взаимодействии белков в клеточных путях в дополнение к данным о последовательности с мутациями. В этих данных алгоритм глубокого обучения обнаруживает закономерности и молекулярные принципы, которые приводят к развитию рака.

«В идеале мы получаем полную картину всех раковых генов в какой-то момент, что может по-разному повлиять на прогрессирование рака у разных пациентов», — говорит Марсико, руководитель исследовательской группы.

В отличие от традиционных методов лечения рака, таких как химиотерапия, персонализированные терапевтические подходы адаптируют препараты именно к типу опухоли. 

«Цель состоит в том, чтобы выбрать лучшую терапию для каждого пациента — то есть наиболее эффективное лечение с наименьшим количеством побочных эффектов. Кроме того, мы могли бы идентифицировать раковые заболевания уже на ранних стадиях, основываясь на их молекулярных характеристиках. Только если мы узнаем причины болезни, мы сможем эффективно противодействовать им или исправлять их», — считают исследователи. «Вот почему так важно выявить как можно больше механизмов, которые могут вызвать рак».

«До сих пор большинство исследований было сосредоточено на патогенных изменениях в генетической последовательности, то есть в схеме клетки», — заявляет Роман Шульте-Сассе (Roman Schulte-Sasse), автор исследования. «В то же время в последние годы стало очевидным, что эпигенетические нарушения или дисрегуляция активности генов также могут привести к раку».

Вот почему исследователи объединили данные последовательности, отражающие ошибки в схеме, с информацией, представляющей события внутри ячейки. Первоначально ученые подтвердили, что мутации, или размножение сегментов генома, действительно являются основными движущими силами рака. Затем, на втором этапе, они точно определили гены, которые находятся в менее прямом контексте с реальным геном, вызывающим рак.

Результаты научной работы

«Например, мы обнаружили гены, последовательность которых в основном неизменна при раке, но при этом незаменима для опухоли, потому что они регулируют подачу энергии», — говорит Шульте-Сассе.

Эти гены выходят из-под контроля другими способами, например, из-за химических изменений в ДНК, таких как метилирование. Эти модификации оставляют информацию о последовательности нетронутой, но управляют активностью гена. 

«Такие гены являются перспективными мишенями для лекарственных средств, но поскольку они работают в фоновом режиме, мы можем найти их только с помощью сложных алгоритмов».

Новая программа добавляет значительное количество новых записей в список предполагаемых раковых генов, который за последние годы вырос до 700-1000. Только благодаря сочетанию биоинформатического анализа и новейших методов искусственного интеллекта ученые смогли отследить скрытые гены.

«Взаимодействие белков и генов может быть отображено в виде математической сети», — считает Шульте-Сассе. «Вы можете думать об этом как о попытке угадать железнодорожную сеть; каждая станция соответствует белку или гену, и каждое взаимодействие между ними является поездным соединением».

С помощью тех самых алгоритмов, которые помогли искусственному интеллекту совершить прорыв в последние годы, исследователи смогли обнаружить даже те соединения, которые ранее оставались незамеченными. Ученые при помощи компьютера смогли проанализировать десятки тысяч различных сетевых карт из 16 различных типов рака, каждая из которых содержала от 12 000 до 19 000 точек данных. В данных скрыто еще много интересных деталей. 

«Мы видим закономерности, которые зависят от конкретного рака и ткани», — считает Марсико. «Мы рассматриваем это как доказательство того, что опухоли запускаются различными молекулярными механизмами в разных органах».

Программа EMOGI не ограничивается раком, подчеркивают исследователи. Теоретически ее можно использовать для интеграции различных наборов биологических данных и поиска там закономерностей, объясняет Марсико. 

«Было бы полезно применить наш алгоритм для аналогичных сложных заболеваний, для которых собираются многогранные данные и где гены играют важную роль. Примером могут служить сложные метаболические заболевания, такие как диабет».

Авторы другого исследования заявляют, что алгоритмы искусственного интеллекта помогут в диагностике диабетической ретинопатии.