Эксперты дали свою оценку новой версии ChatGPT-5.5

Компания OpenAI сделала очередной большой шаг, выпустив GPT-5.5 - самую мощную итерацию своей флагманской модели. Сэм Альтман назвал ее «новым классом интеллекта для реальной работы». Модель уже доступна для платных подписчиков (Plus, Pro, Business и Enterprise) в интерфейсе ChatGPT и приложении Codex, пишет digitalbusiness.kz

Главные технические фишки релиза

OpenAI утверждает, что модель стала на 40% эффективнее при выполнении задач в Codex, расходуя меньше ресурсов на тот же результат при той же скорости.

Впервые OpenAI догнала Anthropic в автоматизации действий на рабочем столе. GPT-5.5 может кликать, печатать и управлять сторонними приложениями (например, Slack) с «человеческой ловкостью».

Нейронка лучше держит нить в многосоставных задачах и не «забывает» детали в длинных документах. 5.5 также помогла найти новое математическое доказательство чисел Рамсея, подтвержденное в Lean.

Мнения и тесты эксперто

Итан Моллик, профессор Уортонской школы (Wharton):

«Это большое событие, которое доказывает, что стремительное улучшение ИИ не закончилось. Я поручил моделям построить красивую 3D-симуляцию развития портового города с 3000 г. до н.э. до 3000 г. н.э. Только GPT-5.5 Pro реально смоделировала эволюцию города, а не просто замену зданий. И сделала это за 20 минут, тогда как версии 5.4 потребовалось 33 минуты», - поделился опытом профессор.

Хуан Пабло Флорес и Абхилаш Хариш Шриватса (CodeRabbit):

«В код-ревью модель достигла точности 79,2%, находя существенно больше полезных багов. Она перестала жаловаться на общие вещи и сфокусировалась на конкретных ошибках, которые стоит исправить. В генерации кода модель выбирает самые точные и минимальные изменения, чтобы не нарушить стабильность всей системы», - констатируют авторы издания.

Стивен Смит, эксперт по ИИ-стратегиям:

«Страшный сон для юристов - в работе с документами. Например, построение хронологии событий по делу из гигабайтов писем и текстов перестает быть кошмаром. Но есть нюанс: GPT-5.5 стала «увереннее в своей неправоте». У нее зафиксирован уровень галлюцинаций в 86%, когда она не знает ответа. Она выдает ложь с лицом эксперта в 2,5 раза чаще, чем конкуренты (Claude или Gemini). Каждую цитату и факт все еще нужно проверять человеком», - заявляет Смит.

Джейк Хэнди, R&D продукт-менеджер:

«Модель помогла настроить инфраструктуру, которая ее же и обслуживает. Codex проанализировал трафик и переписал алгоритмы балансировки нагрузки, ускорив генерацию токенов на 20%. Это шаг к тому самому «суперприложению», о котором мечтали Альтман и Брокман», - говорит Хэнди.

Кстати

API пока не запущен, но ожидается «очень скоро». Цена составит $5 за 1 млн входных и $30 за 1 млн выходных токенов, что в два раза дороже версии 5.4. Контекстное окно расширено до 1 миллиона токенов.

Эксперты дали свою оценку новой версии ChatGPT-5.5

Главные технические фишки релиза

Мнения и тесты эксперто

Итан Моллик, профессор Уортонской школы (Wharton):

Хуан Пабло Флорес и Абхилаш Хариш Шриватса (CodeRabbit):

Стивен Смит, эксперт по ИИ-стратегиям:

Джейк Хэнди, R&D продукт-менеджер:

Кстати

Другие статьи

Kaspi.kz подключился к межбанковской системе мобильных платежей

inDrive запустил в Казахстане новую кампанию по дорожной безопасности «Пристегните свои мечты»

Казахстан решил, что делать свой ламинат выгоднее – и построил завод за 5 млрд тенге