ИИ помог врачам принимать решения, но не улучшил краткосрочные исходы пациентов

Генеративный искусственный интеллект всё активнее тестируют в медицине, но главный вопрос остаётся прежним: помогает ли он не только врачу, но и пациенту. Новое крупное рандомизированное исследование в первичной медицинской помощи показало осторожный результат: инструмент был безопасен и улучшал качество клинического мышления, но не снизил частоту краткосрочных неудач лечения.

Исследование провели специалисты из Бирмингемского университета (University of Birmingham). Работа опубликована в журнале Nature Medicine.

Что проверяли исследователи

В испытание включили более 9600 пациентов из 16 клиник первичной медицинской помощи в Кении. Врачи были случайным образом распределены на две группы: одни пользовались обычной электронной медицинской картой, другие — той же системой, но с встроенным инструментом поддержки решений на основе генеративного искусственного интеллекта.

Генеративный искусственный интеллект — это система, которая может создавать текстовые ответы и рекомендации на основе введённых данных. В этом исследовании инструмент назывался AI Consult. Он работал внутри электронной медицинской карты и анализировал информацию, которую врач вносил во время приёма.

Система предлагала возможные диагнозы и варианты лечения с учётом национальных клинических рекомендаций Кении. Также она отмечала потенциальные проблемы с помощью простой цветовой схемы: зелёный, жёлтый или красный сигнал.

Врач оставался главным

Важная особенность исследования: искусственный интеллект не заменял врача и не принимал решения за него. Клиницист мог принять рекомендацию, отклонить её или поступить иначе. Ответственность за диагноз, назначение лекарств и направление пациента сохранялась за медицинским работником.

Интерфейс искусственного интеллекта не был виден пациентам. Это помогло сохранить обычное взаимодействие между врачом и пациентом, без ощущения, что консультацию ведёт программа.

По словам Билала Матина (Bilal Mateen), одного из старших авторов работы, исследование задавало самый трудный вопрос об искусственном интеллекте в медицине: улучшает ли он исходы для пациентов. Результат, по его словам, одновременно обнадёживает и отрезвляет: технология выглядит безопасной и улучшает отдельные элементы принятия решений, но превращение этих улучшений в измеримую пользу для пациента оказалось гораздо сложнее.

Что показали результаты

Главный показатель — неудача лечения в течение 14 дней — существенно не отличался между группами. В группе с поддержкой искусственного интеллекта этот показатель составил 2,2%, а при стандартной помощи — 2,0%.

Исследователи также не нашли признаков вреда. Частота госпитализаций и смертей была сопоставимой в обеих группах.

При этом инструмент улучшал качество медицинской документации и планирования лечения. Это оценивала независимая группа опытных врачей, которые не знали, использовался ли искусственный интеллект в конкретном случае. Такой «слепой» анализ снижает риск предвзятости.

Удовлетворённость пациентов в обеих группах была одинаковой. Это означает, что присутствие искусственного интеллекта в рабочем процессе не ухудшило восприятие медицинской помощи.

Почему не изменились исходы пациентов

Первичная медицинская помощь часто имеет дело с распространёнными и относительно лёгкими состояниями, часть которых проходит самостоятельно. Поэтому даже если врач принимает чуть более обоснованное решение, это не всегда быстро отражается на таких редких событиях, как госпитализация, смерть или явная неудача лечения.

Аластер Деннистон (Alastair Denniston), соавтор исследования, отметил, что при низкой частоте серьёзных исходов нужны очень крупные испытания. Чтобы обнаружить умеренное влияние на госпитализации или смертность, могут потребоваться исследования более чем на 100 000 пациентов.

Иными словами, отсутствие заметного улучшения за 14 дней не означает, что инструмент бесполезен. Но оно показывает, что улучшение документации и рассуждений врача само по себе ещё не гарантирует быстрый клинический выигрыш.

Что произошло с антибиотиками

Общая частота назначения антибиотиков была похожей в обеих группах. Но расходы, связанные с антибиотиками, оказались ниже там, где врачи пользовались искусственным интеллектом.

Это может означать, что система помогала выбирать более экономичные варианты без увеличения общего числа назначений. Для систем здравоохранения с ограниченными ресурсами такой результат может быть важен, но его нужно оценивать осторожно: снижение стоимости не должно идти в ущерб эффективности и безопасности лечения.

Почему исследование важно для всех стран

Хотя испытание проводилось в Кении, его выводы важны и для стран с высоким уровнем дохода. Во многих системах здравоохранения уже обсуждают внедрение генеративного искусственного интеллекта в клиники, но доказательств его пользы на уровне пациентов пока мало.

Ричард Райли (Richard Riley), старший автор исследования, подчеркнул, что такие строгие испытания нужны для реалистичной оценки искусственного интеллекта. Они помогают понять, где технология действительно полезна, а где ожидания могут быть завышены.

Для стран с уже высоким базовым качеством медицинской помощи эффект может быть ещё труднее обнаружить: если врачи и так часто следуют рекомендациям, добавление подсказок может улучшить отдельные процессы, но не обязательно изменить исходы.

Что это значит для пациентов

Пациентам важно понимать: искусственный интеллект в медицине — это не самостоятельный врач, а инструмент поддержки. Его польза зависит от качества данных, клинических рекомендаций, подготовки специалистов, локального контекста и того, как система встроена в работу клиники.

Новое исследование показывает, что генеративный искусственный интеллект можно безопасно встроить в реальный приём без потери автономии врача и доверия пациента. Но оно также показывает границы технологии: пока нет оснований считать, что такие инструменты автоматически улучшают здоровье пациентов в краткосрочной перспективе.

Вероятно, следующий этап — более крупные исследования, более длительное наблюдение и поиск ситуаций, где поддержка искусственного интеллекта даёт наибольший эффект: например, при сложной диагностике, контроле хронических болезней, выборе терапии или снижении неоправданных назначений.

В более широком смысле медицина переходит от вопросов «может ли искусственный интеллект дать совет?» к более строгому вопросу: «улучшает ли этот совет лечение в реальной клинике?». Ранее также сообщалось, что искусственный интеллект помогает анализировать медицинские данные, но требует осторожной проверки в практике.

Литература

Agweyu A. et al. Generative AI-enabled clinical decision support system in primary care: a pragmatic, cluster-randomized trial // Nature Medicine. 2026. DOI: 10.1038/s41591-026-04503-6.

Что проверяли исследователи

Врач оставался главным

Что показали результаты

Почему не изменились исходы пациентов

Что произошло с антибиотиками

Почему исследование важно для всех стран

Что это значит для пациентов

Литература

Почему при синдроме Кронкайта—Канады в кишечнике образуются полипы

Новый метод помогает увидеть, как клетки печени взаимодействуют внутри ткани

Микробиом кишечника при колоректальном раке: учёные переходят от списка бактерий к поиску механизмов

Говяжий белок усиливал воспаление кишечника у мышей, а гороховый — был связан с более лёгким течением колита