Два профессора финансов из Рочестерского университета и Пенсильванского государственного университета провели пугающий эксперимент. Они использовали языковую модель Claude Opus 4.1 (Anthropic) и за 12 часов сгенерировали 380 готовых научных статей по финансам - с аннотациями, введениями, таблицами, диаграммами и ссылками. Каждая статья объёмом около 30 страниц отформатирована под стандарты ведущих финансовых журналов. Статистические результаты, полученные ИИ, практически неотличимы от результатов, опубликованных в реальных рецензируемых журналах. Авторы эксперимента предупреждают: индустриализация научного мошенничества стала реальностью. Система рецензирования и цитирования может рухнуть под напором лавины статей, сгенерированных алгоритмами.
В академической среде существует давняя вредная привычка - HARKing (Hypothesizing After the Results are Known). Это когда учёный сначала получает результат, а потом задним числом подгоняет под него теорию и публикует это как «оригинальное открытие». Раньше это было трудоёмкое жульничество. Теперь ИИ полностью автоматизировал этот процесс в промышленных масштабах.
Как устроен конвейер
Нови-Маркс и Великов начали с реальных финансовых данных о публичных американских компаниях за десятилетия (базы COMPUSTAT с 1950 года и CRSP с 1926 года). Из этих данных они математически построили более 31 000 потенциальных «сигналов» - закономерностей в бухгалтерских показателях, которые могут предсказывать поведение акций. После серии жёстких статистических тестов осталось всего 95 сигналов, прошедших все проверки качества (около 0,4% от исходного количества).
Затем в дело вступил ИИ. Для каждого из 95 сигналов модель Claude Opus 4.1 сгенерировала четыре полные научные статьи, каждая с разной экономической теорией, «объясняющей» один и тот же результат. Итого: 380 статей. Написание всех 380 заняло у ИИ около 12 часов. Предварительная обработка данных - около суток вычислительного времени.
Качество: не отличить от людей
Каждая статья содержит аннотацию, введение, обзор литературы, описание данных, таблицы результатов, диаграммы и список литературы. Форматирование - под стандарты ведущих финансовых журналов. Названия сигналов ИИ придумывал сам: например, «интенсивность ликвидного рычага» или «использование потенциала приобретений».
Исследователи сравнили статистическую достоверность своих 95 сигналов с 212 сигналами, опубликованными в реальных рецензируемых финансовых журналах. Результаты ИИ оказались практически неотличимыми. Для стратегий с равным весом активов распределение статистических результатов, полученных ИИ, идеально совпало с распределением результатов из опубликованных работ.
Это означает, что планка, которую устанавливает экспертная оценка финансовых исследований, может быть не выше той, которую способен преодолеть автоматизированный анализ данных.
Тесты на читабельность показали, что тексты ИИ находятся на уровне 16-18 лет образования - это уровень выпускника вуза, соответствующий ведущим журналам. Правда, у текстов, написанных людьми, стилистический разброс шире, а у ИИ - более предсказуемый и «отточенный». Но для обмана рецензента этого достаточно.
Почему это катастрофа
Авторы не отправляли свои 380 статей в журналы - эксперимент был предупреждением. Но если бы отправили, последствия были бы сокрушительными.
Перегрузка системы рецензирования. Отправка 380 статей повлечёт за собой сотни тысяч долларов затрат на рецензирование для профессионального сообщества. Если хотя бы небольшая часть исследователей примет такой подход, система научных журналов рухнет под тяжестью статей.
Нарушение системы цитирования. Каждая сгенерированная ИИ статья содержит ссылки на предыдущие исследования - включая, во многих случаях, собственные более ранние работы авторов. В масштабе сотен или тысяч статей автоматическая генерация цитирований может искусственно завысить этот показатель. А индекс цитируемости - один из главных критериев при найме учёных, распределении грантов и присвоении званий.
Авторы подсчитали: если поисковые системы проиндексируют 95 статей, сгенерированных в этом эксперименте, каждая из них может получить сотни дополнительных цитирований - даже если ни один реальный читатель не решит их процитировать.
Что делать?
Авторы не считают, что ИИ в науке - это абсолютное зло. Он может демократизировать исследования, снижать барьеры, ускорять открытия. Проблема не в самом ИИ, а в тайном, масштабном, индустриальном применении для фабрикации «открытий».
Нови-Маркс и Великов предлагают:
· Полная ответственность автора за любой текст, сгенерированный ИИ (простое раскрытие факта использования - слишком слабая мера).
· Новые системы проверки, способные выявлять порочный круг рассуждений, избыточные теории и вымышленные цитаты (галлюцинации ИИ).
· Оценка теорий по их предсказательной силе — то есть требуют от исследователя продемонстрировать, что его теория предсказывает нечто за пределами тех данных, на которых она построена.
«Искусственный интеллект теперь способен создавать огромное количество научных работ в больших масштабах, и это изменит саму природу производства и распространения знаний. Это ранний предупреждающий сигнал о том, что нас ждёт», - говорит Михаил Великов.
В российской академической науке система оценки (публикации в журналах из списка ВАК, РИНЦ, международные базы) также подвержена манипуляциям. Эксперимент американских учёных показывает, что с появлением ИИ старые способы накрутки цитирований и фабрикации статей уходят в прошлое - их место занимает автоматизированный конвейер, который может штамповать сотни правдоподобных работ за считанные часы.
Для российских вузов и научных фондов это сигнал: нужно срочно пересматривать критерии оценки учёных, внедрять системы обнаружения ИИ-контента и требовать от исследователей больше прозрачности. Иначе через несколько лет невозможно будет отличить реальное открытие от продукта «научного конвейера».




