Конкурента ИИ-модели OpenAI o1 создали всего за 50 долларов. Вот как ученые это сделали

О редакции Топ-10 казахстанских стартапов по версии Digital Business
Дата публикации: 06.02.2025, 10:21
ИИ

Группа ученых из Стэнфорда и Вашингтонского университета представила модель искусственного интеллекта под названием s1, которая может конкурировать с ИИ-моделями o1 от OpenAI и R1 от DeepSeek. Что примечательно, создание этой модели обошлось исследователям всего в 50 долларов на облачных вычислениях, пишет digitalbusiness.kz по материалам исследовательской статьи.

Модель s1 уже продемонстрировала отличные результаты в тестах на математические и кодирующие способности, аналогичные более дорогим моделям. Кстати, сама модель уже доступна на GitHub, включая код и данные для обучения.

Команда, стоящая за s1, использовала процесс дистилляции — обучения новой модели на ответах другой, более сложной модели ИИ. В данном случае, с использованием данных из модели Google Gemini 2.0 Flash Thinking Experimental, ученые смогли создать высококачественную модель рассуждений, значительно сэкономив на вычислениях.

В отличие от крупных лабораторий, таких как DeepSeek и OpenAI, которые используют дорогие методы обучения с подкреплением, команда s1 применяла доступный метод контролируемой тонкой настройки (SFT), что позволило снизить затраты. Эта методика позволяет добиться высокой производительности, обучая модель на относительно небольшом наборе данных.

30 минут и в бой

После обучения, которое заняло менее 30 минут с использованием 16 графических процессоров Nvidia H100, s1 показала хорошие результаты в тестах. По словам ученых, необходимые вычисления стоили им около 20 долларов за аренду мощности. В статье также упоминается, что такой подход поставил вопросы перед крупными лабораториями и индустрией в целом. Как отмечают эксперты, если несколько исследователей могут создать высокопроизводительную модель за сравнительно небольшие деньги, это ставит под сомнение «товаризацию» и монополизацию технологий ИИ крупными компаниями.

В тему:

Как DeepSeek обучил ИИ за $6 млн. Эксперт раскрыл секрет китайского стартапа