Исследование показало миллионы ошибочных ответов в Google AI Overviews

Исследование показало миллионы ошибочных ответов в Google AI Overviews
Иллюстративное фото: Depositphotos

Функция AI Overviews от Google, которая формирует сгенерированные искусственным интеллектом ответы в поиске, демонстрирует точность на уровне 85-91%. Об этом свидетельствует анализ стартапа Oumi и The New York Times, проведенный на основе более 4000 запросов с использованием теста SimpleQA.

В октябре, когда AI Overviews работали на базе Gemini 2, точность составляла 85%. После перехода на Gemini 3 в феврале этот показатель вырос до 91%.

Читайте также"Условие – украинский язык": как устроена премия для стримеров Stream Awards – интервью с СЕО Awerti

Учитывая масштабы поиска, даже небольшая доля ошибок превращается в миллионы некорректных ответов каждый час.

Исследование также показало, что более половины правильных ответов являются "неподтвержденными" – они содержат ссылки на источники, которые не полностью соответствуют приведенной информации. Среди таких источников часто фигурируют социальные платформы, в частности Facebook и Reddit.

Примеры ошибок включают неправильные даты или противоречивые утверждения даже при наличии корректных источников. В некоторых случаях система некорректно интерпретирует информацию с сайтов или добавляет ложный контекст к правильным фактам. Также искусственный интеллект может подхватывать ложные утверждения из блогов и подавать их как достоверные.

Недавно в Чехии искусственный интеллект Google в поиске перепутал стоматологию с полицией. А технологические миллиардеры США заработали более $550 млрд на буме ИИ.