ИИ в медицинских исследованиях: быстрый анализ не гарантирует надежных выводов

Искусственный интеллект (ИИ) все активнее входит в клинические и популяционные исследования, но новая статья в журнале npj Digital Medicine предупреждает: скорость обработки данных не заменяет научную строгость, экспертную проверку и понимание причинно-следственных связей.

Авторы работы разобрали, как ИИ-инструменты встраиваются в медицинские исследования, и показали важную проблему: многие такие программы создаются в логике науки о данных, где главное — найти закономерность в уже имеющихся массивах информации. Но эпидемиология, то есть наука о распространении заболеваний и факторах риска в популяциях, устроена иначе: здесь заранее задают дизайн исследования, формулируют гипотезу, контролируют систематические ошибки и отдельно оценивают причинность.

Где возникает риск ошибки

На первый взгляд ИИ может делать почти все, что нужно исследователю: загружать набор данных, писать программный код, строить статистическую модель и выдавать результат. Но в медицине опасность часто скрывается не в скорости, а в том, что именно программа считает «правильным» анализом.

Например, для специалиста по эпидемиологии статистическая значимость обычно связана с заранее заданной проверкой гипотезы и порогом достоверности. В науке о данных «значимость» может означать вес признака внутри модели, то есть то, насколько сильно он помогает предсказывать результат. Это не одно и то же. Хорошее предсказание не всегда объясняет причину болезни.

Проверка на примере курения и инфаркта

В статье приведен показательный пример. ИИ-инструмент попросили ответить на вопрос: каково причинное влияние текущего курения на риск инфаркта миокарда, то есть повреждения сердечной мышцы из-за нарушения кровотока?

В первом варианте программа получила простой запрос, похожий на то, как мог бы спросить неопытный исследователь. ИИ построил логистическую регрессию — статистическую модель, которую часто используют для оценки вероятности события, — и выдал рабочий код. Но при экспертной проверке обнаружились серьезные методологические ошибки.

Главная проблема: программа не построила причинную модель и не определила, какие переменные нужно учитывать, чтобы снизить риск искажения результата. Кроме того, она неверно истолковала отношение шансов как прямое увеличение вероятности. Это принципиальная ошибка: шансы и вероятность связаны, но не равны друг другу.

Даже «умная подсказка» не решила проблему

Во втором варианте исследователи дали ИИ более грамотную инструкцию: попросили построить направленный ациклический граф (Directed Acyclic Graph, DAG) — схему, которая помогает показать предполагаемые причинные связи между факторами. Такой подход часто используют в эпидемиологии, чтобы заранее понять, какие данные нужно учитывать при анализе.

ИИ действительно создал схему, но она оказалась концептуально слабой и не соответствовала медицинской литературе. Более того, программа не использовала собственный граф в следующих шагах анализа. Затем выполнение прервалось из-за ошибки обработки данных: система не смогла преобразовать текстовую переменную в числовую. В первом запуске такой ошибки не было.

Это важное наблюдение: результат ИИ может выглядеть аккуратно и убедительно, но при этом оставаться научно ненадежным.

Человек остается частью исследования

Авторы предлагают рассматривать ИИ не как автономного исследователя, а как инструмент с разными уровнями автоматизации. В статье описана пятиступенчатая шкала: от базовой автоматизации под строгим контролем человека до полной автоматизации, при которой программа действует самостоятельно.

Для клинических и популяционных исследований, где ошибки могут повлиять на лечение, профилактику и политику здравоохранения, авторы считают необходимым постоянное участие эксперта. Исследователь должен проверять текст, код, статистические модели и смысл выводов — примерно так же, как научная статья проходит рецензирование: что-то отклоняется, что-то исправляется, а что-то принимается.

Что это значит для врачей и пациентов

Для пациента главный вывод простой: медицинский ИИ может быть полезен, но его выводы не должны восприниматься как окончательная истина. Алгоритм может быстро обработать данные, но не всегда понимает клинический контекст, причины болезни и возможные источники ошибки.

Для врачей и исследователей работа напоминает: внедрение ИИ требует прозрачных процедур. Нужно заранее понимать, где именно используется программа, какие решения оставлены человеку, как проверяется код и можно ли воспроизвести результат при повторном анализе.

Похожая проблема уже обсуждается и в клинической практике: когда ИИ помогает врачу, важно заранее определить, где заканчивается роль алгоритма и начинается ответственность специалиста.

Литература

Postill G. et al. Integrating artificial intelligence tools in health research // npj Digital Medicine. — 2026. — DOI: 10.1038/s41746-026-02739-7.

Medical Insider