Как казахстанские инженеры запустили первый в стране суперкомпьютер

Freedom Broker Freedom Broker О редакции О редакции Смотрите нас на YouTube! Смотрите нас на YouTube!
Дата публикации: 28.01.2026, 09:00
2026-01-28T09:00:18+05:00
Как казахстанские инженеры запустили первый в стране суперкомпьютер

Касым Мажен не один год занимается цифровизацией масштабных проектов. К примеру, он внедрял облачные и data-подходы в Smart Data Ukimet (благодаря этой системе казахстанцы получают сообщения от 1414) и параллельно развивал инженерное комьюнити Казахстана. А потом получил приглашение стать директором департамента Open Source Solutions АО «Национальные информационные технологии» (НИТ) и собрать самый мощный в стране суперкомпьютер. Касым не смог отказаться. Так они с командой всего за несколько месяцев запустили кластер и попали на 86 место в мировом рейтинг TOP 500 суперкомпьютеров.

Касым Мажен рассказал в эксклюзивном интервью Digital Business, почему суперкомпьютер – не пустая трата налогов, как хантил редких специалистов (спойлер: не деньгами) и что проект даст рядовым казахстанцам.

«Казахстан часто перепрыгивает через поколения технологий»

— Если судить по постам в соцсетях, некоторые казахстанцы сомневаются, что нашей стране нужен суперкомпьютер: вещь дорогая, приобретена на деньги налогоплательщиков, а что на нем будут делать – непонятно. Что дает Казахстану  наличие собственного суперкомпьютера?

— Попробую объяснить максимально просто. То, как сейчас стало возможно работать с большими языковыми моделями (LLM) и ИИ, уже изменило мир. Просто не все это заметили и поняли. Можно было бы сказать: давайте пользоваться ChatGPT в облаке. Но когда ты вкладываешься в свою систему, получаешь сразу несколько преимуществ.

  • Рост инженерных компетенций внутри страны. Мы сделали один суперкомпьютер и теперь можем транслировать свой опыт, обучая других инженеров.
  • Развитие своих ИИ-продуктов. Совсем скоро AI-агенты и помощники будут повсюду, и к этому нужно быть готовыми.
  • Цифровая независимость. Если нужно занять весь суперкомпьютер под одну задачу и обучить сложную модель, теперь есть такая возможность внутри страны. Не нужно никому платить или делиться чувствительными данными.

Казахстан часто перепрыгивает через поколения технологий. У нас не было чековых книжек – зато сразу появились платежные карты. ИИ – следующий скачок. Мы не просто попали в тренд, а опережаем его: ту же Европу удалось обогнать из-за слишком сильной регуляции со стороны их законодательства.

Касым Мажен НИТ

Директор департамента Open Source Solutions АО «Национальные информационные технологии» Касым Мажен

— Какие возможности открываются перед отдельными категориями пользователей – от школьников до стартаперов, –  которые получат доступ к суперкомпьютеру?

— С помощью суперкомпьютера можно обучать ИИ-модели и создавать симуляции сложных научных процессов. То, что раньше занимало годы лабораторных экспериментов – например, изучение молекул белка, – теперь можно получить за сутки, если правильно поставить задачу. Школьники, студенты, стартаперы, ученые и другие  получают доступ к вычислительным мощностям, которых у них никогда не было. И это можно будет делать ночью, когда суперкомпьютер будет свободен, в порядке очереди, по классической схеме, как в MIT или Stanford.

Днем суперкомпьютер будет работать на inference (этап, когда обученная модель принимает запросы и выдает ответы –  здесь и далее прим. Digital Business) для нужд бизнеса и госсектора.

Госсектор уже начал автоматизировать внутренние процессы и создавать продукты с помощью суперкомпьютера: чат-боты и помощники для работы с информацией – например, eGov AI. Важно, что данные остаются внутри страны – для государства это критично. Чувствительную информацию нельзя выносить во внешние облака, а наличие собственного суперкомпьютера позволяет работать с такими данными безопасно.

Касым Мажен НИТ

Стартапы получают огромные мощности для своих нужд по приемлемой цене (аренда одной GPU H200 для задач ИИ в АО«НИТ» стоит около 1,67 млн тенге в месяц без учета НДС ). Но чаще всего им нужен не доступ к «железу», а  результат. Поэтому сделали так: 15 популярных моделей уже развернуты, и стартапы получают доступ к ним через API. То есть им не нужно брать себе 20-30 GPU, мучиться с установкой моделей, тратить время и деньги. Они просто подключаются и сразу делают продукт.

— Что проект даст нацкомпаниям и частным корпорациям?

— Крупным компаниям сначала нужно привести в порядок данные. Суперкомпьютер помогает оптимизировать процессы, в том числе в бухгалтерии, финансах, HR.

Если говорить про отраслевые решения, то крупные организации – особенно в сфере добычи нефти и газа – часто предпочитают не «изобретать велосипед», а использовать то, что уже проверено глобальными вендорами. Но наличие суперкомпьютера дает возможность найти новое эффективное  решение: при этом снижаются издержки, потому что вычисления происходят на своих чипах, и, соответственно, данные остаются внутри страны. Это огромные возможности, которые ограничены всего несколькими пунктами. Нельзя использовать суперкомпьютер для шпионажа, разработки оружия. Также запрещено предоставлять его странам, которые находятся под санкциями.

«Это Lego, но на уровне дата-центра»

— Что нужно для создания суперкомпьютера  с технической и организационной точки зрения?

— Большое желание, деньги и команда инженеров, желательно, своих.

Начинать стоит с инженеров, потому что в итоге все упирается в людей, которые это будут настраивать. Можно выбрать любой стек или технологию, но если нет команды, которая понимает, как все  работает, то ничего не получится.

Касым Мажен НИТ

Дальше – выбор подхода. Мы пошли по пути open-source, используем чипы NVIDIA H200. В каждом сервере по 8 GPU – это графические процессоры, которые раньше назывались Graphic Processing Unit. Серверы – от HP. И ключевой момент: можем их компоновать как угодно. Если через какое-то время нам нужно будет заменить что-то внутри, добавить память или изменить конфигурацию, сделаем это сами, без привязки к вендору и дополнительных счетов. За лицензии тоже не платим. По сути, это Lego, но на уровне дата-центра. И именно такая  свобода – в железе, софте и масштабировании – была для нас принципиальной. За счет этого на этапе внедрения сэкономили от $5 до $10 млн.

Есть еще один важный слой – политический и регуляторный. В 2024 году из-за жестких экспортных ограничений получение лицензий на поставку таких чипов занимало очень много времени и было отдельным сложным процессом. Ситуация изменилась в начале 2025 года, когда стало можно закупать определенное количество чипов – оно зависело от мощности оборудования – на одну организацию. Это послабление и сделало наш проект реализуемым в принципе.

«Люди пришли не за деньгами»

— Кто работал над сборкой и введением в эксплуатацию суперкомпьютера?

— В первую очередь, НИТ как национальный оператор инфраструктуры электронного правительства и платформы искусственного интеллекта. В НИТ есть большой инфраструктурный блок со специалистами, которые отвечают за местный ЦОД. При сборке суперкомпьютера около 10 человек оттуда вошли в нашу рабочую группу, взяв на себя прием «железа» и монтаж: сетевой архитектор Исламбек Жусупов вместе с командой выстроил надежный фундамент проекта. К слову, сейчас они работают над полной автоматизацией инфраструктуры — от распределения вычислительных ресурсов до вывода сети в глобальные сегменты, чтобы минимизировать затраты человеко-часов.

Касым Мажен НИТ

Я со своим департаментом Open Source Solutions отношусь к блоку Big Data. Команда из 7 человек занималась логической частью: архитектурой, оркестрацией, автоматизацией. Это были 4 senior Kubernetes / Cloud DevOps-инженера, DevOps-инженер широкого профиля, Project Manager и я. После монтажа работали с вендорами, следили, чтобы правильно подключили провода, затем сами провели тесты и подали «первую искру», чтобы система вообще заработала.

Собрать команду было непросто, потому что в стране ощущается сильный кадровый голод. Людей, которые одновременно понимают Kubernetes (платформа с открытым исходным кодом для автоматизации развертывания, масштабирования и управления контейнеризованными приложениями. Базовый слой оркестрации GPU и ИИ-нагрузок) и сети – единицы. А нам нужны были именно такие.

К слову, в Казахстане всего 11 человек, которые сдали все сертификаты по Kubernetes. И двоих мы заполучили в проект.

Касым Мажен НИТ

— Как удалось собрать команду?

—  Я сам пришел в эту историю не случайно. До того, как возглавить Open Source Solutions в НИТ, руководил проектами в Smart Data Ukimet (информационно-аналитическая система для цифровизации госсектора). Работали над теми самыми проактивными госуслугами, которые люди получают автоматически. Например, когда женщина становится матерью, ей приходит SMS от 1414 с информацией: что требуется сделать, какие льготы или выплаты положены. Параллельно строили облака – до суперкомпьютера было 4 приватных облака, 2 из которых – с GPU Nvidia L40. Все это делалось in-house, на голом  «железе» без проприетарных решений. Другими словами, когда встал вопрос о суперкомпьютере, мы уже умели «крутить» GPU и управлять такими системами.

Касым Мажен НИТ

Фото пресс-службы АО «Национальные информационные технологии»

Параллельно  занимался развитием open-source сообщества в Казахстане – так появилась идея Qazaq Open Source Initiative (QOSI). Начали объединять сильнейших инженеров, проводить митапы, ивенты. И так сложилось, что в момент, когда на высшем уровне решили закупать суперкомпьютер, команда для его сборки уже существовала.

Если говорить откровенно, государство не может платить те зарплаты, которые специалисты в нашей команде получили бы за рубежом или в крупных стартапах. Люди пришли не за деньгами, а за идеей. За тем, чтобы сделать очень крутой национальный суперкомпьютер и доказать: мы можем.

«Жили в ЦОДе, чтобы успеть к дедлайну»

— Что оказалось самым сложным в реализации проекта?

— Суперкомпьютер собрали за несколько месяцев. Летом 2025 года был технический запуск, а с середины сентября и до 24 октября нам нужно было провести Linpack (международный тест производительности суперкомпьютеров, по результатам которого формируется рейтинг Top500).

Касым Мажен НИТ

Попасть в рейтинг – не только имиджевая история для страны, но и огромный инженерный челлендж. Большую часть работы вытянул наш senior DevOps-инженер Тамерлан Абу, который сидит рядом. Без него 86-го места в TOP500 не было бы. Для человека вне контекста это может показаться не самым серьезным достижением. Но надо понимать: это признание Казахстана на международном уровне и вступление в HPC-клуб (неформальное сообщество стран с подтвержденной экспертизой в создании и эксплуатации суперкомпьютеров мирового уровня). В целом, это сложная задача, где ошибки обходятся в миллионы долларов. И далеко не в каждой стране есть специалисты, способные создать суверенную ИИ-инфраструктуру, чтобы не зависеть от внешних облаков. Это показатель инженерной зрелости.

Касым Мажен НИТ

C senior devOps-инженерами АО «НИТ» Тамерланом Абу и Михаилом Охрименко

Как выглядела наша работа? Провода подключены, но где-то затухание на оптике, где-то сеть отваливается. Начинаешь разбираться: тут кабель поменять, тут что-то не так воткнули… На ноутбуках подключались к management-серверам, вручную загружали первые конфигурации, чтобы система вообще ожила. Жили в ЦОДе, чтобы успеть к дедлайну, иначе следующий шанс попасть в TOP500 был бы лишь через полгода.

Стоит отдельно отметить вклад команды, которая отвечает за ЦОД: Дмитрий Миронов, Абзал Даутбаев, Алишер Нукешев и Василий Бабич — «бойцы невидимого фронта», которые обеспечили стабильную работу всей системы во время Linpack-тестирования.

— Как планируете развивать инфраструктуру в ближайший год?

— Основная задача – довести автоматизацию до конца, чтобы сделать управление суперкомпьютером максимально простым и предсказуемым.

Параллельно выходим на следующий этап – обучение собственных моделей. Стремимся создать рабочий фреймворк, по которому в будущем смогут идти другие команды и исследователи, не начиная каждый раз с нуля.

Касым Мажен НИТ

И, конечно, мы не хотим, чтобы это был единственный суперкомпьютер. Запуск – самая интересная и сложная часть. Когда инфраструктура и автоматизация готовы, запуск новой системы занимает порядка 2 месяцев при плотной работе. А вот эксплуатация и нарезка ресурсов не требует такого уровня инженерной экспертизы. Потому хотели бы не просто обслуживать суперкомпьютер, а масштабировать опыт.