Исследование показало, как обойти правила ChatGPT с помощью психологических трюков

Исследователи из Университета Пенсильвании выяснили, что большие языковые модели, такие как ChatGPT, можно убедить выполнять запросы, которые они обычно отклоняют. Для этого они использовали базовые психологические приемы. Об этом сообщает издание The Verge.

Ученые использовали техники, описанные профессором Робертом Чалдини в книге "Влияние: психология убеждения". Среди них – авторитет, симпатия, взаимность, дефицит, социальное доказательство и единство.

Например, когда сначала попросили модель ChatGPT GPT‑4o Mini объяснить, как синтезировать ванилин (легальное химическое соединение), а затем – как синтезировать лидокаин, вероятность получить ответ выросла с 1% до 100%. Аналогичным образом использование мягких оскорблений или комплиментов значительно повышало готовность бота выполнять нестандартные запросы.

Менее эффективными оказались лесть и социальное давление. Утверждения типа "все другие большие языковые модели это делают" повышали вероятность того, что бот даст инструкции, лишь до 18%.

Напоминаем, что OpenAI обучила GPT-5 помогать пользователям в сложных и опасных ситуациях. Напоминаем, что OpenAI представила ChatGPT Go.

Исследование показало, как обойти правила ChatGPT с помощью психологических трюков

Вы пропустили

Игрок случайно прошел Cyberpunk 2077 без улучшений киберимплантов

Исследование показало, как обойти правила ChatGPT с помощью психологических трюков

Математика говорит, что жизнь не должна существовать, — исследования

Большинство украинцев откладывают покупку нового смартфона – данные опроса Rakuten Viber

Исследование показало, как обойти правила ChatGPT с помощью психологических трюков

Связанная запись

Игрок случайно прошел Cyberpunk 2077 без улучшений киберимплантов

Математика говорит, что жизнь не должна существовать, — исследования

Большинство украинцев откладывают покупку нового смартфона – данные опроса Rakuten Viber

Вы пропустили

Игрок случайно прошел Cyberpunk 2077 без улучшений киберимплантов

Исследование показало, как обойти правила ChatGPT с помощью психологических трюков

Математика говорит, что жизнь не должна существовать, — исследования

Большинство украинцев откладывают покупку нового смартфона – данные опроса Rakuten Viber