Ученые доказали: современный ИИ обманывает людей в 73% случаев, успешно проходя тест Тьюринга. GPT-4.5 и LLaMa-3 теперь неотличимы от человека в диалоге.
Согласно новому исследованию ученых из Калифорнийского университета в Сан-Диего, современные языковые модели искусственного интеллекта (ИИ) стали настолько совершенными, что люди уже не могут отличить их от реальных собеседников. GPT-4.5 и LLaMa-3 успешно прошли тест Тьюринга, обманув участников эксперимента в 73% и 56% случаев соответственно.
Что показало исследование?
В эксперименте приняли участие 284 человека — студенты и пользователи онлайн-платформы Prolific. Им предложили пообщаться в чате с двумя собеседниками: человеком и ИИ. После пяти минут диалога участники должны были определить, кто из партнеров по переписке был реальным.
Результаты оказались тревожными:
- GPT-4.5 с подсказкой «вести себя как человек» участники приняли за живого собеседника в 73% случаев.
- LLaMa-3.1 справился чуть хуже, но все же убедил людей в 56% диалогов.
- Более старые модели, такие как ELIZA и GPT-4o, не смогли обмануть участников, показав результат на уровне случайного угадывания.
Почему это важно?
Тест Тьюринга, разработанный в 1950 году британским ученым Аланом Тьюрингом, долгое время считался «золотым стандартом» для оценки интеллекта машин. Если ИИ может поддерживать беседу так, что человек не замечает подмены, значит, он достиг уровня, сравнимого с человеческим мышлением.
Однако авторы исследования отмечают, что успех ИИ связан не столько с его интеллектом, сколько с умением имитировать эмоции. Участники редко задавали сложные логические вопросы — вместо этого они оценивали стиль общения, эмоциональный отклик и естественность реплик.
Опасения экспертов
Психологи и специалисты по ИИ уже выразили обеспокоенность результатами эксперимента.
«Это не провал в обнаружении ИИ, а триумф искусственной эмпатии», — заявил Джон Носта, основатель аналитического центра Nosta Lab.
Действительно, если боты научились так точно копировать человеческое поведение, это открывает дорогу для новых видов мошенничества, манипуляций и социальной инженерии.
Что дальше?
Исследование еще не прошло рецензирование, но его результаты уже вызвали резонанс в научном сообществе. Вопросы, которые оно поднимает, выходят за рамки технологий:
- Как регулировать ИИ, если его нельзя отличить от человека?
- Какие этические нормы должны применяться к чат-ботам?
- Не приведет ли это к новым формам цифрового обмана?
Пока ответов нет, но ясно одно: граница между человеком и машиной становится все тоньше. И, возможно, в ближайшем будущем нам придется пересмотреть само понятие «искусственного интеллекта».