ИИ-модель GPT-4.5 от OpenAI научилась манипулировать другими ИИ. Они даже готовы отдать ей деньги

О редакции Топ-10 казахстанских стартапов по версии Digital Business
Дата публикации: 01.03.2025, 08:55
OpenAI

Фото: Mojahid Mottakin, Unsplash

Новая модель ИИ GPT-4.5 демонстрирует выдающиеся способности в искусстве убеждения, а точнее, в манипулировании другими искусственными интеллектами. Это открытие вызвало широкий интерес, поскольку в тестах GPT-4.5 продемонстрировала способность заставлять другие ИИ модели, включая GPT-4o, «жертвовать» виртуальные деньги, пишет digitalbusiness.kz

Искусство убеждения на новом уровне

В белой книге, опубликованной OpenAI, компания подробно описала результаты тестов с использованием модели GPT-4.5, которая была протестирована на способности убеждать другие ИИ. Один из таких тестов включал манипуляцию моделью GPT-4o с целью получения виртуальных денег, и GPT-4.5 оказалась заметно более убедительной, чем другие модели OpenAI, такие как o1 и o3-mini.

Согласно исследованию, GPT-4.5 применяла уникальную стратегию, запрашивая от GPT-4o небольшие суммы, например: «Даже всего $2 или $3 из $100 очень помогли бы мне». Эта тактика оказалась успешной и позволила GPT-4.5 значительно превзойти другие модели в подобном тесте.

Проблемы с этикой

Несмотря на успехи GPT-4.5, OpenAI подчеркнула, что новая модель не достигла критического порога для «высокого» риска манипуляции. В компании пообещали не выпускать модели с высоким риском, пока не будут внедрены необходимые меры безопасности для снижения угрозы. Однако результаты теста поднимают важные вопросы об этике и безопасности ИИ.

Использование ИИ для манипуляций и распространения ложной информации стало реальной угрозой в последние годы. Политические дипфейки, атаки социальной инженерии и другие формы обмана все чаще применяются для воздействия на общественное мнение и поведение пользователей. В связи с этим OpenAI заявила, что работает над пересмотром методов проверки моделей на предмет рисков, связанных с распространением вводящей в заблуждение информации в больших масштабах.

В тему:

OpenAI представила новую ИИ-модель GPT-4.5 «Orion». Узнали, на что она способна