Inception и MBZUAI представили SHERKALA – языковую модель для казахского языка

Freedom Broker О редакции
Дата публикации: 06.03.2025, 17:48
SHERKALA

В феврале 2025 года компания Inception (G42), ведущий разработчик AI-решений, совместно с Университетом Искусственного Интеллекта Мохаммеда бин Зайеда (MBZUAI) и при поддержке Cerebras объявили о запуске SHERKALA – одной из первых высокоточных казахских языковых моделей (LLM). Этот инновационный проект направлен на расширение возможностей более 13 миллионов носителей казахского языка, обеспечивая им доступ к передовым технологиям генеративного ИИ.

SHERKALA – это модель с 8 миллиардами параметров, обученная на 45 миллиардах слов и словосочетаний, с основным фокусом на казахском языке, а также поддержкой английского, русского и турецкого. Она использует Llama 3.1, адаптированную для казахского языка, с расширением токенизатора на 25%, что повышает эффективность понимания и генерации текста. Обучение модели проходило на Condor Galaxy, одном из самых мощных суперкомпьютеров для ИИ, созданном G42 и Cerebras.

SHERKALA

«Запуск SHERKALA – это важный шаг в поддержке языковых сообществ, которые раньше были недостаточно представлены в AI. Вместе с MBZUAI мы создали модель, которая поможет носителям казахского языка и изменит рынок LLM, сделав технологии более доступными и эффективными. С моделями JAIS для арабского, NANDA для хинди и теперь SHERKALA для казахского мы продолжаем расширять границы AI и обеспечивать языковое разнообразие в цифровом мире»,отметил CEO Inception (G42) Эндрю Джексон.

SHERKALA задает новый уровень для казахских языковых моделей, отлично справляясь с пониманием и созданием текстов. Благодаря эффективной работе с токенами и продвинутым диалоговым возможностям, она обходит более крупные модели, включая те, что в несколько раз превышают ее по параметрам.

«Мы рады работать с Inception над SHERKALA — передовой казахской AI-моделью. Этот проект помогает развивающимся рынкам, делает AI доступнее, сохраняет язык и поддерживает цифровые сообщества»заявил заведующий кафедрой и профессор обработки естественного языка в MBZUAI Преслав Наков.

SHERKALA теперь доступна как open-source модель на Hugging Face:
🔗 SHERKALA на Hugging Face