Эксперты дали свою оценку новой версии ChatGPT-5.5
Компания OpenAI сделала очередной большой шаг, выпустив GPT-5.5 - самую мощную итерацию своей флагманской модели. Сэм Альтман назвал ее «новым классом интеллекта для реальной работы». Модель уже доступна для платных подписчиков (Plus, Pro, Business и Enterprise) в интерфейсе ChatGPT и приложении Codex, пишет digitalbusiness.kz
Главные технические фишки релиза
OpenAI утверждает, что модель стала на 40% эффективнее при выполнении задач в Codex, расходуя меньше ресурсов на тот же результат при той же скорости.
Впервые OpenAI догнала Anthropic в автоматизации действий на рабочем столе. GPT-5.5 может кликать, печатать и управлять сторонними приложениями (например, Slack) с «человеческой ловкостью».
Нейронка лучше держит нить в многосоставных задачах и не «забывает» детали в длинных документах. 5.5 также помогла найти новое математическое доказательство чисел Рамсея, подтвержденное в Lean.
Мнения и тесты эксперто
Итан Моллик, профессор Уортонской школы (Wharton):
«Это большое событие, которое доказывает, что стремительное улучшение ИИ не закончилось. Я поручил моделям построить красивую 3D-симуляцию развития портового города с 3000 г. до н.э. до 3000 г. н.э. Только GPT-5.5 Pro реально смоделировала эволюцию города, а не просто замену зданий. И сделала это за 20 минут, тогда как версии 5.4 потребовалось 33 минуты», - поделился опытом профессор.
Хуан Пабло Флорес и Абхилаш Хариш Шриватса (CodeRabbit):
«В код-ревью модель достигла точности 79,2%, находя существенно больше полезных багов. Она перестала жаловаться на общие вещи и сфокусировалась на конкретных ошибках, которые стоит исправить. В генерации кода модель выбирает самые точные и минимальные изменения, чтобы не нарушить стабильность всей системы», - констатируют авторы издания.
Стивен Смит, эксперт по ИИ-стратегиям:
«Страшный сон для юристов - в работе с документами. Например, построение хронологии событий по делу из гигабайтов писем и текстов перестает быть кошмаром. Но есть нюанс: GPT-5.5 стала «увереннее в своей неправоте». У нее зафиксирован уровень галлюцинаций в 86%, когда она не знает ответа. Она выдает ложь с лицом эксперта в 2,5 раза чаще, чем конкуренты (Claude или Gemini). Каждую цитату и факт все еще нужно проверять человеком», - заявляет Смит.
Джейк Хэнди, R&D продукт-менеджер:
«Модель помогла настроить инфраструктуру, которая ее же и обслуживает. Codex проанализировал трафик и переписал алгоритмы балансировки нагрузки, ускорив генерацию токенов на 20%. Это шаг к тому самому «суперприложению», о котором мечтали Альтман и Брокман», - говорит Хэнди.
Кстати
API пока не запущен, но ожидается «очень скоро». Цена составит $5 за 1 млн входных и $30 за 1 млн выходных токенов, что в два раза дороже версии 5.4. Контекстное окно расширено до 1 миллиона токенов.