ИИ смог выдать себя за человека в коротком текстовом разговоре

Современные модели искусственного интеллекта могут быть приняты за человека в короткой переписке, если им заранее задать убедительную «человеческую» роль. К такому выводу пришли авторы исследования, опубликованного в журнале Proceedings of the National Academy of Sciences (PNAS).

Речь идёт не о том, что искусственный интеллект (ИИ) «стал человеком» или приобрёл сознание. Исследование показывает другое: в ограниченном текстовом диалоге современные большие языковые модели способны достаточно убедительно имитировать стиль, эмоции и социальные привычки живого собеседника.

Что проверяли исследователи

Учёные провели классический трёхсторонний тест Тьюринга. Тест Тьюринга — это эксперимент, предложенный Аланом Тьюрингом (Alan Turing) в 1950 году: человек задаёт вопросы двум собеседникам и пытается понять, кто из них человек, а кто машина.

В трёхсторонней версии судья одновременно переписывается с двумя участниками: одним реальным человеком и одной системой ИИ. После короткого разговора он должен выбрать, кто из них человек.

Такой формат сложнее для машины, чем обычная беседа один на один: судья сравнивает ответы ИИ не с абстрактным представлением о «человеческом разговоре», а с живым собеседником рядом.

Какие системы участвовали

В исследовании сравнивали четыре системы: старый чат-бот ELIZA, работавший по заранее заданным правилам, и три большие языковые модели. Большая языковая модель — это программа, обученная на огромных массивах текстов и способная строить ответы на естественном языке.

В основной части эксперимента участвовали GPT-4o, LLaMA-3.1-405B и GPT-4.5. Затем авторы провели повторную проверку с LLaMA-3.1-405B и GPT-5.

Всего в основной серии было 1023 игры. В них участвовали две группы людей: 126 студентов и 158 пользователей платформы Prolific. В каждой игре судья в течение пяти минут вёл две параллельные текстовые беседы — с человеком и с ИИ — и затем выносил решение.

Почему «роль» оказалась решающей

Модели проверяли в двух условиях. В первом они отвечали без специальной «личности». Во втором им задавали образ: молодой, интровертный человек, хорошо знающий интернет-культуру и свободно использующий разговорный язык.

Разница оказалась большой. В пятиминутных беседах GPT-4.5 с заданной ролью была принята за человека в 73% случаев. LLaMA-3.1-405B с такой же настройкой достигла 56%.

Без «человеческой» роли результаты резко падали: GPT-4.5 и LLaMA-3.1-405B без неё получали 36% и 38% соответственно. Старый чат-бот ELIZA, как и ожидалось, заметно уступал современным моделям.

Длиннее разговор — не всегда безопаснее

Авторы также провели повторный эксперимент, где разговор длился не пять, а 15 минут. Можно было бы ожидать, что за более долгий диалог ИИ легче «раскусить». Но это произошло не полностью.

GPT-5 с заданной человеческой ролью всё ещё показывала высокий результат: модель принимали за человека в 59,3% случаев. LLaMA-3.1-405B в этой версии получила 55,6%.

Это важная деталь: даже более продолжительная переписка сама по себе не гарантирует, что человек уверенно отличит модель от реального собеседника.

Людей убеждал не интеллект, а стиль

Самый интересный вывод исследования касается не только возможностей ИИ, но и того, как люди распознают «человечность».

Судьи чаще опирались не на сложные логические задачи и не на математические рассуждения. Их сильнее убеждали стиль речи, естественность общения, эмоциональные реакции, небольшие социальные сигналы и способность поддерживать разговор.

Иными словами, модель выигрывала не потому, что «думала как человек», а потому, что убедительно выглядела человеком в коротком социальном взаимодействии.

Почему это может быть опасно

Авторы называют одну из главных проблем «поддельными людьми» — автоматизированными собеседниками, которые выглядят как реальные пользователи. Это может иметь последствия для общения в социальных сетях, службы поддержки, онлайн-знакомств, политической агитации, мошенничества и распространения недостоверной информации.

Если человек не понимает, что разговаривает с машиной, он может доверять ей больше, чем следовало бы. Особенно опасны ситуации, где ИИ имитирует поддержку, дружбу, экспертность или личный интерес.

При этом само исследование не говорит, что такие модели обязательно будут использоваться во вред. Оно показывает, что техническая возможность убедительной имитации уже достаточно близка к повседневной реальности.

Что это значит для обычного пользователя

Главный практический вывод прост: в интернете всё труднее судить о собеседнике только по тому, как он пишет. Грамотный, эмоциональный, шутливый или «слишком человеческий» текст уже не является надёжным доказательством, что перед вами реальный человек.

Особенно осторожно стоит относиться к собеседникам, которые быстро вызывают доверие, просят деньги, подталкивают к срочным решениям, предлагают медицинские или финансовые советы либо пытаются повлиять на политические взгляды.

Похожий вопрос — может ли ИИ не только имитировать человека, но и менять убеждения людей — уже обсуждался в материале «Общение с искусственным интеллектом способно изменить взгляды сторонников теории заговора».

Что остаётся неясным

Исследование проводилось в ограниченных условиях: короткие текстовые беседы, конкретные модели, определённые подсказки и выбранные группы участников. В реальной жизни диалоги могут быть длиннее, сложнее и эмоционально насыщеннее.

Авторы считают, что дальнейшие исследования должны проверить, смогут ли специалисты по ИИ лучше распознавать машины, если разговор длится дольше и если у них есть больше инструментов для проверки.

Пока же работа показывает важный сдвиг: вопрос уже не только в том, насколько ИИ «умён», а в том, насколько убедительно он умеет вести себя как человек.

Литература

Jones C. R., Bergen B. K. Large language models pass a standard three-party Turing test // Proceedings of the National Academy of Sciences. 2026. Vol. 123, № 21. DOI: 10.1073/pnas.2524472123.

Что проверяли исследователи

Какие системы участвовали

Почему «роль» оказалась решающей

Длиннее разговор — не всегда безопаснее

Людей убеждал не интеллект, а стиль

Почему это может быть опасно

Что это значит для обычного пользователя

Что остаётся неясным

Литература

Искусственный интеллект в лаборатории: LabVantage представила CORTEX для работы с данными

Физическая активность может помочь бросить курить

ИИ начал проектировать еду: BurgerAI создал бургеры под вкус, питание и экологичность

ИИ научился видеть, как риск рака молочной железы меняется по маммограммам