Церен Анджукаев, Нуралы Жанбырбаев, Дмитрий Санджиев и Артем Иванов нашли способ, как можно быстро собирать большие массивы материалов для обучения ИИ-моделей, и основали стартап NCSpeech. Компания уже генерирует прибыль, а в апреле победила на национальном ИИ-конкурсе Alem.ai Battle – ребята получили награду из рук президента Казахстана Касыма-Жомарта Токаева и приз – 10 млн тенге.
Специально для совместного проекта Digital Business и Astana Hub «100 стартап-историй Центральной Евразии» Церен и Дмитрий рассказали, как устроен рынок данных для AI, зачем компаниям миллионы фото, видео и аудиозаписей из реальной жизни и почему собирать их удобно через такси и доставку.
«Технарям сложно совмещать написание кода с B2B-продажами»
– Чем занимались до основания NCSpeech?
Церен: – У меня академический бэкграунд, давно работаю в области машинного обучения и AI, в том числе в голосовых технологиях. В R&D-центрах частных компаний занимался исследованиями и публиковал научные статьи. Сейчас у них уже более 500 цитирований. Также трудился вместе с Артемом Ивановым в стартапе Ayta AI, который основал фаундер inDrive Арсен Томский: делали продукт для людей с заиканием.
Нуралы Жанбырбаев тоже инженер. Он взаимодействовал с крупными корпоративными заказчиками из банковского сектора и создавал голосовые сервисы для компаний.
Дмитрий Санджиев – единственный член команды без технического бэкграунда, но с большим предпринимательским опытом. Нам, технарям, в начале пути было сложно совмещать написание кода с B2B-продажами и выстраиванием отношений с корпорациями. Когда присоединился Дима с бизнес-экспертизой, это нас усилило.
– Что именно разрабатывает стартап?
Церен: – NCSpeech — это B2B-платформа, которая помогает быстро собирать и подготавливать датасеты для AI-разработчиков.
Почему это важно? Сейчас разработка алгоритмов и обучение моделей – решаемая и почти рутинная задача. Главные ценности на пути к AGI (общему искусственному интеллекту) — качественные данные для обучения и вычислительные мощности. Мы как раз хотим заняться первым направлением.
Церен Анджукаев
– Откуда появилась такая идея?
Церен: – NCSpeech создали в марте 2025 года, но мы изначально приходили к крупным компаниям с готовыми голосовыми AI-решениями. Однако на переговорах постоянно слышали одну и ту же мысль: обучить модель – не главная проблема. Гораздо сложнее собрать, очистить и разметить качественные данные.
В прошлом году Нуралы особенно хорошо подсветил проблему на примере банков. Им нужны закрытые AI-решения, так как они не могут передавать данные клиентов по API в OpenAI или Google из-за политики конфиденциальности. Но даже если бы могли, то глобальные модели плохо работают с казахским языком, особенно когда речь идет о смеси казахского и русского. А чтобы голосовой сервис нормально понимал локальный язык, акценты, диалекты и живую речь, сначала нужен большой массив проверенных и размеченных записей.
Нуралы Жанбырбаев и Артем Иванов
Собрали их для голосовых моделей на казахском, а потом столкнулись с похожими задачами на малайском, филиппинском и вьетнамском языках. Так постепенно поняли: наша главная ценность и экспертиза – работа с данными.
Дмитрий: – Один из показательных кейсов – с малайзийским банком. Ему нужно было добавить голосовое управление в банковское приложение. Из-за того, что в Малайзии несколько распространенных языков, то глобальные модели на 50% не понимают, что говорит человек.
Дмитрий Санджиев
Собрали данные, привлекли локальных лингвистов для проверки фраз и обучили локальную модель, которая уже могла понимать клиентов банка. Для этого разработали собственную мультиагентную платформу: она распределяет задания между исполнителями, собирает результаты и проверяет качество выполнения. Если система видит, что задание сделано плохо, оно возвращается исполнителю с комментариями.
Эта история позволила посмотреть на ситуацию шире: подобных проблем полно в Юго-Восточной и Центральной Азии, Африке, на Ближнем Востоке, в Латинской Америке. Это страны с огромным количеством языков и культур, которые недостаточно представлены в глобальных AI-датасетах.
При этом публичные датасеты в интернете уже исчерпаны. Компаниям, которые делают беспилотные автомобили, роботов-доставщиков или умные камеры, нужны фото и видео из естественной среды. Например, где найти информацию о том, как внешне выглядит конкретная улица в Шымкенте? Нужны не просто картинки из открытого доступа, а полноценный датасет – тысячи свежих изображений.
Артем Иванов
Поэтому в рамках NCSpeech решили сфокусироваться на сборе данных. С этой идеей команда пошла на национальный конкурс AI-проектов Alem.ai Battle. В категории стартапов NCSpeech получил главный приз – 10 млн тенге.
Мы нашли product-market fit: наша экспертиза идеально совпала с тем, что нужно рынку.
«Готовимся к запуску пилота с крупным супераппом в Казахстане»
– Как можно собирать данные?
Дмитрий: – Где найти людей, которые находятся в реальной городской среде и у которых есть свободное время? В крупных приложениях, которыми люди уже пользуются каждый день: такси, доставка, маркетплейсы, финтех-решения. Часто такие сервисы объединены в супераппы – приложения, где внутри одной экосистемы есть сразу несколько услуг.
Курьеры и водители 30-40% времени проводят в ожидании заказа, а пассажир во время поездки сидит 15-20 минут в телефоне и скроллит ленты соцсетей.
Наша идея в том, чтобы интегрировать NCSpeech в такие сервисы. Когда садитесь в такси, то получаете пуш-уведомление: «Хотите скидку 20% на текущую поездку? Тогда выполните пару заданий». Пользователя могут попросить сфотографировать ладонь, записать короткое селфи-видео или надиктовать текст.
– Кому нужна такая информация?
Дмитрий: – Компании, занимающиеся биометрией, готовы покупать базы с фотографиями ладоней – по доллару за снимок. Видео с лицами нужны банкам и разработчикам решений для удаленной верификации клиентов. А глобальным AI-компаниям нужны уже огромные массивы информации из разных стран, чтобы адаптировать свои алгоритмы под локальные рынки, языки и сценарии.
– Зачем супераппам интегрироваться с NCSpeech?
Дмитрий: – Для супераппа это новый источник дохода. К тому же партнер не тратит на это собственный маркетинговый бюджет: скидки и бонусы пользователям оплачивает заказчик – компания, которая покупает собранные фото, видео или аудиозаписи. Кроме того, приложение может получать и другую выгоду от AI-революции: например, информация о внедрении ИИ может повышать капитализацию бизнеса.
Всю техническую часть берем на себя: от внедрения модуля до верификации датасетов.
– Компании готовы встраивать такой функционал?
Дмитрий: – В мире есть уже примеры подобных коллабораций. В конце прошлого года Uber запустил в США и Индии проект, в котором водителям в моменты простоя предложили собирать и размечать данные. В марте этого года DoorDash (крупнейшая доставка в США) запустила сбор информации о «последнем метре» – их курьеры фотографируют входы в здания или рестораны.
Сейчас готовимся к запуску пилота с крупным супераппом в Казахстане. Фокус будет на сборе видео- и аудиоматериалов. Также ведем переговоры с крупнейшим партнером в Юго-Восточной Азии.
«Рассчитываем быстро выйти на ARR в несколько миллионов долларов»
– Каким компаниям нужны услуги по сбору датасетов?
Дмитрий: – Первый уровень – глобальные гиганты (Google, Meta, Anthropic), которым нужны огромные объемы информации для адаптации своих моделей под локальные реалии.
Второй уровень – компании и государства, создающие «суверенный ИИ». Сюда же относятся крупные банки, которым нужно обучать модели в закрытом корпоративном контуре.
Наконец, специфические датасеты нужны стартапам, которые получили финансирование на создание нишевых AI-сервисов.
На сегодня у нас есть несколько клиентов в Казахстане и Юго-Восточной Азии. В основном это банки, финансовые организации и AI-лаборатории при крупных холдингах.
– Сколько это стоит?
Церен: – Собирать данные – дорогое удовольствие. Чеки начинаются от десятков тысяч долларов – это тот минимум, с которого вообще есть смысл запускать подобные проекты.
Поэтому рассчитываем довольно быстро выйти на ARR в несколько миллионов долларов. Мировой рынок сбора и разметки данных для AI сейчас оценивается в $3,8 млрд, и, по прогнозам, через несколько лет превысит 10 миллиардов.
– Какие есть ограничения на этом рынке?
Церен: – Принципиально не связываемся с незаконной деятельностью или санкционными компаниями.
Одна китайская компания просила собрать фото и видео спящих детей до двух лет – вероятно, чтобы обучать алгоритмы для умной видеоняни. Но поскольку проверить это невозможно, то мы отказались.
Дмитрий: – Строго соблюдаем законы о защите персональных данных. Во-первых, дизайним задачи так, чтобы исключить передачу чувствительной личной информации. Например, если нам нужна голосовая запись, пользователей просим рассказать, условно, о погоде, а не назвать номер паспорта.
Во-вторых, если на фото или видео попадают лица случайных прохожих или номера машин, то они автоматически размываются или вырезаются перед передачей заказчику.
Ну и в целом процесс сбора информации абсолютно добровольный: перед выполнением задания пользователь подписывает соглашение, где четко указано, для чего собираются данные. Если это человеку некомфортно, он просто может не выполнять задачу.
Нуралы Жанбырбаев
«Хотим привлечь около $3 млн от сильного лид-инвестора из США или Сингапура»
– На какой стадии проект находится сейчас?
Церен: – Активно масштабируемся: проект уже генерирует выручку и сам себя окупает. Теперь нам нужно расширять команду: нанимать сильных продактов, инженеров, специалистов по продажам.
– Сколько уже вложили в NCSpeech?
Церен: – Первые полгода полностью финансировали проект из своего кармана. Никто не получал зарплату, хотя на рынке каждый из наших инженеров стоит от $5 тыс. в месяц. В тот период нам очень помогли гранты на облачную инфраструктуру от программ AWS и Google Cloud. Также NCSpeech является участником Astana Hub и получает налоговые льготы.
Летом привлекли $110 тыс. от сингапурского венчурного фонда Antler, что было не только сильной финансовой поддержкой. Бонусом получили нетворкинг в Юго-Восточной Азии и подтверждение ценности продукта от глобального игрока.
– Ищете ли инвестиции сейчас?
Церен: – Как уже говорил, операционно прибыльны, но необходимо финансирование для скорости. Планируем привлечь около $3 млн, и нам нужен сильный лид-инвестор из США или Сингапура, который даст не только деньги, но и экспертизу, связи.
Будучи инженерами, к поиску средств подошли системно: ищем фаундеров, которые уже подняли деньги от интересных нам фондов, и выстраиваем с ними отношения. Наша цель – получить от них «теплое интро» к инвестору. В Кремниевой долине это вопрос репутации. Никто не будет рекомендовать откровенных «балбесов», чтобы не испортить свое имя. Процесс небыстрый и, скорее всего, потребует личных встреч.
«Несправедливо, что нейросети плохо говорят на казахском»
– Много ли конкурентов в мире? Чем вы от них отличаетесь?
Церен: – На рынке есть такие крупные игроки, как Scale AI, Toloka, Appen и другие компании, которые уже стоят миллиарды долларов.
Наше преимущество в подходе и фокусе. Во-первых, фокусируемся на рынках, где глобальные модели работают плохо. Во-вторых, не тратим деньги на привлечение пользователей, а приходим к людям через партнерские супераппы и говорим: «Вы едете в такси, у вас есть 15 минут. Помогите нам оценить качество кода или текста по вашей специальности и получите бонус прямо сейчас». Так моментально получаем видео и фото от тысяч пользователей.
– Каким видите проект в долгосрочной перспективе?
Церен: – Глобальная цель – построить системного инфраструктурного игрока в области данных на развивающихся рынках.
Несправедливо, что нейросети отлично понимают английский, но плохо говорят на казахском или малайском. Хотим стать платформой, к которой компании и государства будут обращаться за данными для обучения своих AI-моделей.