
Функция AI Overviews от Google, которая формирует сгенерированные искусственным интеллектом ответы в поиске, демонстрирует точность на уровне 85-91%. Об этом свидетельствует анализ стартапа Oumi и The New York Times, проведенный на основе более 4000 запросов с использованием теста SimpleQA.
В октябре, когда AI Overviews работали на базе Gemini 2, точность составляла 85%. После перехода на Gemini 3 в феврале этот показатель вырос до 91%.
Читайте также"Условие – украинский язык": как устроена премия для стримеров Stream Awards – интервью с СЕО Awerti
Учитывая масштабы поиска, даже небольшая доля ошибок превращается в миллионы некорректных ответов каждый час.
Исследование также показало, что более половины правильных ответов являются "неподтвержденными" – они содержат ссылки на источники, которые не полностью соответствуют приведенной информации. Среди таких источников часто фигурируют социальные платформы, в частности Facebook и Reddit.
Примеры ошибок включают неправильные даты или противоречивые утверждения даже при наличии корректных источников. В некоторых случаях система некорректно интерпретирует информацию с сайтов или добавляет ложный контекст к правильным фактам. Также искусственный интеллект может подхватывать ложные утверждения из блогов и подавать их как достоверные.
Недавно в Чехии искусственный интеллект Google в поиске перепутал стоматологию с полицией. А технологические миллиардеры США заработали более $550 млрд на буме ИИ.