Глава OpenAI Сэм Альтман в интервью Роуэну Ченгу поделился, что эффективность следующей версии ChatGPT – условной GPT-6 – будут оценивать не по привычным тестам, а по реальной пользе, которую она приносит пользователям и бизнесу, пишет digitalbusiness.kz.
Главный показатель – созданная ценность
По словам Альтмана, команда OpenAI работает над новой метрикой GDPval (от value created – «созданная ценность»). Она покажет, как модель помогает в реальных задачах, а не только в решении коротких тестов и викторин.
«Бенчмарки устарели – они не отражают, насколько ИИ действительно полезен в долгих процессах», – отметил Альтман.
GPT-6 планируют проверять по тому, как она справляется с многошаговыми задачами, где нужно не просто ответить, а работать часами или даже днями – например, как это делают автономные ИИ-агенты.
ИИ-агенты станут основным показателем эффективности
В OpenAI уверены, что будущее за интеллектуальными агентами, которые смогут самостоятельно выполнять проекты, взаимодействовать с инструментами и завершать реальные дела. Именно через таких агентов и будут измерять результативность GPT-6 – по устойчивости, эффективности и качеству работы.
Компании без сотрудников – не фантастика
Альтман также подтвердил интерес к концепции «компаний с нулевым штатом» (zero-person companies) – бизнесов, где люди задают цели, а всю операционную часть выполняют ИИ-агенты.
По его словам, такие компании могут появиться раньше, чем ожидается, и станут тестовой площадкой для новой системы оценки GPT-6.
Может быть интересно:
OpenAI добавила в ChatGPT функцию оплаты товаров в интернете