Глава OpenAI Сэм Альтман в интервью Роуэну Ченгу поделился, что эффективность следующей версии ChatGPT – условной GPT-6 – будут оценивать не по привычным тестам, а по реальной пользе, которую она приносит пользователям и бизнесу, пишет digitalbusiness.kz.

Главный показатель – созданная ценность

По словам Альтмана, команда OpenAI работает над новой метрикой GDPval (от value created – «созданная ценность»). Она покажет, как модель помогает в реальных задачах, а не только в решении коротких тестов и викторин.

«Бенчмарки устарели – они не отражают, насколько ИИ действительно полезен в долгих процессах», – отметил Альтман.

GPT-6 планируют проверять по тому, как она справляется с многошаговыми задачами, где нужно не просто ответить, а работать часами или даже днями – например, как это делают автономные ИИ-агенты.

ИИ-агенты станут основным показателем эффективности

В OpenAI уверены, что будущее за интеллектуальными агентами, которые смогут самостоятельно выполнять проекты, взаимодействовать с инструментами и завершать реальные дела. Именно через таких агентов и будут измерять результативность GPT-6 – по устойчивости, эффективности и качеству работы.

Компании без сотрудников – не фантастика

Альтман также подтвердил интерес к концепции «компаний с нулевым штатом» (zero-person companies) – бизнесов, где люди задают цели, а всю операционную часть выполняют ИИ-агенты.

По его словам, такие компании могут появиться раньше, чем ожидается, и станут тестовой площадкой для новой системы оценки GPT-6.

Может быть интересно:

OpenAI добавила в ChatGPT функцию оплаты товаров в интернете

Новый GPT будет работать как сотрудник компании

Главный показатель – созданная ценность

ИИ-агенты станут основным показателем эффективности

Компании без сотрудников – не фантастика

Другие статьи

Техника в Казахстане подорожала перед Новым годом на 15%

Сколько мяса можно будет вывезти из Казахстана: утверждены новые квоты

Михаил Ломтадзе подвел итоги года и пообещал, что Kaspi.kz продолжит удивлять в 2026-м