Учёные разработали семейство геномных языковых моделей resLens — инструментов искусственного интеллекта, которые анализируют последовательности ДНК и помогают находить гены устойчивости к антибиотикам. Такие гены позволяют бактериям выживать при лечении и могут передаваться между микроорганизмами, ускоряя распространение лекарственной устойчивости. Работа опубликована в журнале npj Antimicrobials and Resistance.
Почему нужны новые инструменты
Антибиотикорезистентность — способность бактерий противостоять действию антибиотиков — остаётся одной из ключевых угроз для медицины. Чтобы отслеживать её распространение, исследователи ищут гены устойчивости в бактериальных геномах.
Обычно для этого используют методы сравнения с базами данных: новая последовательность сопоставляется с уже известными генами. Такой подход полезен, но у него есть слабое место. Если новый ген заметно отличается от известных образцов, программа может его не распознать.
resLens пытается решить именно эту задачу. Модель не только ищет буквальное совпадение с базой, но и улавливает закономерности в последовательностях ДНК — примерно так же, как языковая модель распознаёт структуру текста, только вместо слов здесь используются фрагменты генетического кода.
Как обучали resLens
Исследователи собрали набор генов устойчивости к антибиотикам из двух крупных источников: базы Pathogen Detection RefGene Национального центра биотехнологической информации и базы ResFinder. Повторяющиеся последовательности и вложенные дубликаты удалили, чтобы модель не «училась» на копиях одного и того же сигнала.
В итоговый набор вошло более 7600 генов устойчивости, относящихся к 12 классам антибиотиков. Для сравнения добавили такое же количество бактериальных генов, не связанных с устойчивостью.
Модель обучали в двух режимах. Первый режим отличал гены устойчивости от обычных бактериальных генов. Второй определял, к какому классу антибиотиков относится найденный ген устойчивости. Отдельно проверяли короткие фрагменты ДНК длиной 150 пар оснований и более длинные последовательности.
Где модель показала себя лучше
На длинных последовательностях resLens превзошла несколько существующих инструментов, включая методы выравнивания последовательностей и другие модели глубокого обучения. Глубокое обучение — это подход, при котором программа сама находит сложные закономерности в данных, а не следует только заранее заданным правилам.
Однако преимущество не было абсолютным. На коротких фрагментах некоторые классические инструменты, включая KARGA и RGI, работали лучше. Это важная деталь: resLens не заменяет все существующие методы, а может дополнять их там, где обычное сравнение с базами данных становится недостаточным.
Проверка на «новых» генах
Особенно интересной была проверка на семействах генов, которые специально исключили из обучающего набора. Это позволило оценить, сможет ли модель распознавать варианты, которые она раньше не видела.
Для теста выбрали гены устойчивости к аминогликозидам и бета-лактамам — двум важным группам антибиотиков. resLens смогла классифицировать такие скрытые от обучения гены, хотя точность различалась: для семейства blaADC результат был лучше, чем для aminoglycoside nucleotidyltransferase.
Это говорит о потенциале модели, но также показывает её ограничение: чем сильнее новый ген отличается от уже известных примеров, тем осторожнее нужно трактовать результат.
Почему это не готовый «диагностический вердикт»
Авторы также проверили resLens на данных полного секвенирования генома бактерий с подтверждённой устойчивостью к антибиотикам. В этой части модель находила по крайней мере один ген, соответствующий известному устойчивому фенотипу, чаще, чем ResFinder, и была сопоставима с RGI.
Но сами исследователи подчёркивают: эта проверка была предварительной. Набор геномов был небольшим, лабораторные данные по устойчивости не охватывали все возможные механизмы, а для каждого случая не было точной привязки «конкретный ген — конкретная устойчивость».
Поэтому resLens пока следует рассматривать как инструмент предварительного поиска и выдвижения гипотез. Он может подсказать, где искать новый механизм устойчивости, но окончательный вывод всё равно требует проверки биологами и клиническими микробиологами.
Что это может изменить
Если такие модели будут надёжно доработаны, они могут ускорить наблюдение за появлением новых вариантов устойчивости. Это важно для больниц, лабораторий общественного здравоохранения и исследовательских центров: чем раньше обнаружен потенциально опасный ген, тем быстрее можно понять, какие антибиотики могут перестать работать.
При этом исследование напоминает: искусственный интеллект в микробиологии особенно полезен не как «чёрный ящик», который сам всё решает, а как дополнительный фильтр. Он помогает увидеть подозрительные сигналы, которые затем нужно подтвердить другими методами.
О том, как разные вещества могут влиять на устойчивость бактерий к антибиотикам, ранее рассказывалось в материале МКБ-11 «Кофеин против антибиотиков: неожиданная находка учёных».
Литература
Mollerus M., Dittmar K., Crandall K. A., Rahnavard A. resLens: genomic language models to enhance antibiotic resistance gene detection // npj Antimicrobials and Resistance. 2026. DOI: 10.1038/s44259-026-00219-2.
