Церен Анджукаев, Нуралы Жанбырбаев, Дмитрий Санджиев и Артем Иванов нашли способ, как можно быстро собирать большие массивы материалов для обучения ИИ-моделей, и основали стартап NCSpeech. Компания уже генерирует прибыль, а в апреле победила на национальном ИИ-конкурсе Alem.ai Battle – ребята получили награду из рук президента Казахстана Касыма-Жомарта Токаева и приз – 10 млн тенге.
Специально для совместного проекта Digital Business и Astana Hub «100 стартап-историй Центральной Евразии» Церен и Дмитрий рассказали, как устроен рынок данных для AI, зачем компаниям миллионы фото, видео и аудиозаписей из реальной жизни и почему собирать их удобно через такси и доставку.
«Технарям сложно совмещать написание кода с B2B-продажами»
– Чем занимались до основания NCSpeech?
Церен: – У меня академический бэкграунд, давно работаю в области машинного обучения и AI, в том числе в голосовых технологиях. В R&D-центрах частных компаний занимался исследованиями и публиковал научные статьи. Сейчас у них уже более 500 цитирований. Также трудился вместе с Артемом Ивановым в стартапе Ayta AI, который основал фаундер inDrive Арсен Томский: делали продукт для людей с заиканием.
Нуралы Жанбырбаев тоже инженер. Он взаимодействовал с крупными корпоративными заказчиками из банковского сектора и создавал голосовые сервисы для компаний.
Дмитрий Санджиев – единственный член команды без технического бэкграунда, но с большим предпринимательским опытом. Нам, технарям, в начале пути было сложно совмещать написание кода с B2B-продажами и выстраиванием отношений с корпорациями. Когда присоединился Дима с бизнес-экспертизой, это нас усилило.
– Что именно разрабатывает стартап?
Церен: – NCSpeech — это B2B-платформа, которая помогает быстро собирать и подготавливать датасеты для AI-разработчиков.
Почему это важно? Сейчас разработка алгоритмов и обучение моделей – решаемая и почти рутинная задача. Главные ценности на пути к AGI (общему искусственному интеллекту) — качественные данные для обучения и вычислительные мощности. Мы как раз хотим заняться первым направлением.
Церен Анджукаев
– Откуда появилась такая идея?
Церен: – NCSpeech создали в марте 2025 года, но мы изначально приходили к крупным компаниям с готовыми голосовыми AI-решениями. Однако на переговорах постоянно слышали одну и ту же мысль: обучить модель – не главная проблема. Гораздо сложнее собрать, очистить и разметить качественные данные.
В прошлом году Нуралы особенно хорошо подсветил проблему на примере банков. Им нужны закрытые AI-решения, так как они не могут передавать данные клиентов по API в OpenAI или Google из-за политики конфиденциальности. Но даже если бы могли, то глобальные модели плохо работают с казахским языком, особенно когда речь идет о смеси казахского и русского. А чтобы голосовой сервис нормально понимал локальный язык, акценты, диалекты и живую речь, сначала нужен большой массив проверенных и размеченных записей.
Нуралы Жанбырбаев и Артем Иванов
Собрали их для голосовых моделей на казахском, а потом столкнулись с похожими задачами на малайском, филиппинском и вьетнамском языках. Так постепенно поняли: наша главная ценность и экспертиза – работа с данными.
Дмитрий: – Один из показательных кейсов – с малайзийским банком. Ему нужно было добавить голосовое управление в банковское приложение. Из-за того, что в Малайзии несколько распространенных языков, то глобальные модели на 50% не понимают, что говорит человек.
Дмитрий Санджиев
Собрали данные, привлекли локальных лингвистов для проверки фраз и обучили локальную модель, которая уже могла понимать клиентов банка. Для этого разработали собственную мультиагентную платформу: она распределяет задания между исполнителями, собирает результаты и проверяет качество выполнения. Если система видит, что задание сделано плохо, оно возвращается исполнителю с комментариями.
Эта история позволила посмотреть на ситуацию шире: подобных проблем полно в Юго-Восточной и Центральной Азии, Африке, на Ближнем Востоке, в Латинской Америке. Это страны с огромным количеством языков и культур, которые недостаточно представлены в глобальных AI-датасетах.
При этом публичные датасеты в интернете уже исчерпаны. Компаниям, которые делают беспилотные автомобили, роботов-доставщиков или умные камеры, нужны фото и видео из естественной среды. Например, где найти информацию о том, как внешне выглядит конкретная улица в Шымкенте? Нужны не просто картинки из открытого доступа, а полноценный датасет – тысячи свежих изображений.
Артем Иванов
Поэтому в рамках NCSpeech решили сфокусироваться на сборе данных. С этой идеей команда пошла на национальный конкурс AI-проектов Alem.ai Battle. В категории стартапов NCSpeech получил главный приз – 10 млн тенге.
Мы нашли product-market fit: наша экспертиза идеально совпала с тем, что нужно рынку.
«Готовимся к запуску пилота с крупным супераппом в Казахстане»
– Как можно собирать данные?
Дмитрий: – Где найти людей, которые находятся в реальной городской среде и у которых есть свободное время? В крупных приложениях, которыми люди уже пользуются каждый день: такси, доставка, маркетплейсы, финтех-решения. Часто такие сервисы объединены в супераппы – приложения, где внутри одной экосистемы есть сразу несколько услуг.
Курьеры и водители 30-40% времени проводят в ожидании заказа, а пассажир во время поездки сидит 15-20 минут в телефоне и скроллит ленты соцсетей.
Наша идея в том, чтобы интегрировать NCSpeech в такие сервисы. Когда садитесь в такси, то получаете пуш-уведомление: «Хотите скидку 20% на текущую поездку? Тогда выполните пару заданий». Пользователя могут попросить сфотографировать ладонь, записать короткое селфи-видео или надиктовать текст.
– Кому нужна такая информация?
Дмитрий: – Компании, занимающиеся биометрией, готовы покупать базы с фотографиями ладоней – по доллару за снимок. Видео с лицами нужны банкам и разработчикам решений для удаленной верификации клиентов. А глобальным AI-компаниям нужны уже огромные массивы информации из разных стран, чтобы адаптировать свои алгоритмы под локальные рынки, языки и сценарии.
– Зачем супераппам интегрироваться с NCSpeech?
Дмитрий: – Для супераппа это новый источник дохода. К тому же партнер не тратит на это собственный маркетинговый бюджет: скидки и бонусы пользователям оплачивает заказчик – компания, которая покупает собранные фото, видео или аудиозаписи. Кроме того, приложение может получать и другую выгоду от AI-революции: например, информация о внедрении ИИ может повышать капитализацию бизнеса.
Всю техническую часть берем на себя: от внедрения модуля до верификации датасетов.
– Компании готовы встраивать такой функционал?
Дмитрий: – В мире есть уже примеры подобных коллабораций. В конце прошлого года Uber запустил в США и Индии проект, в котором водителям в моменты простоя предложили собирать и размечать данные. В марте этого года DoorDash (крупнейшая доставка в США) запустила сбор информации о «последнем метре» – их курьеры фотографируют входы в здания или рестораны.
Сейчас готовимся к запуску пилота с крупным супераппом в Казахстане. Фокус будет на сборе видео- и аудиоматериалов. Также ведем переговоры с крупнейшим партнером в Юго-Восточной Азии.
«Рассчитываем быстро выйти на ARR в несколько миллионов долларов»
– Каким компаниям нужны услуги по сбору датасетов?
Дмитрий: – Первый уровень – глобальные гиганты (Google, Meta, Anthropic), которым нужны огромные объемы информации для адаптации своих моделей под локальные реалии.
Второй уровень – компании и государства, создающие «суверенный ИИ». Сюда же относятся крупные банки, которым нужно обучать модели в закрытом корпоративном контуре.
Наконец, специфические датасеты нужны стартапам, которые получили финансирование на создание нишевых AI-сервисов.
На сегодня у нас есть несколько клиентов в Казахстане и Юго-Восточной Азии. В основном это банки, финансовые организации и AI-лаборатории при крупных холдингах.
– Сколько это стоит?
Церен: – Собирать данные – дорогое удовольствие. Чеки начинаются от десятков тысяч долларов – это тот минимум, с которого вообще есть смысл запускать подобные проекты.
Поэтому рассчитываем довольно быстро выйти на ARR в несколько миллионов долларов. Мировой рынок сбора и разметки данных для AI сейчас оценивается в $3,8 млрд, и, по прогнозам, через несколько лет превысит 10 миллиардов.
– Какие есть ограничения на этом рынке?
Церен: – Принципиально не связываемся с незаконной деятельностью или санкционными компаниями.
Одна китайская компания просила собрать фото и видео спящих детей до двух лет – вероятно, чтобы обучать алгоритмы для умной видеоняни. Но поскольку проверить это невозможно, то мы отказались.
Дмитрий: – Строго соблюдаем законы о защите персональных данных. Во-первых, дизайним задачи так, чтобы исключить передачу чувствительной личной информации. Например, если нам нужна голосовая запись, пользователей просим рассказать, условно, о погоде, а не назвать номер паспорта.
Во-вторых, если на фото или видео попадают лица случайных прохожих или номера машин, то они автоматически размываются или вырезаются перед передачей заказчику.
Ну и в целом процесс сбора информации абсолютно добровольный: перед выполнением задания пользователь подписывает соглашение, где четко указано, для чего собираются данные. Если это человеку некомфортно, он просто может не выполнять задачу.
Нуралы Жанбырбаев
«Хотим привлечь около $3 млн от сильного лид-инвестора из США или Сингапура»
– На какой стадии проект находится сейчас?
Церен: – Активно масштабируемся: проект уже генерирует выручку и сам себя окупает. Теперь нам нужно расширять команду: нанимать сильных продактов, инженеров, специалистов по продажам.
– Сколько уже вложили в NCSpeech?
Церен: – Первые полгода полностью финансировали проект из своего кармана. Никто не получал зарплату, хотя на рынке каждый из наших инженеров стоит от $5 тыс. в месяц. В тот период нам очень помогли гранты на облачную инфраструктуру от программ AWS и Google Cloud. Также NCSpeech является участником Astana Hub и получает налоговые льготы.
Летом привлекли $110 тыс. от сингапурского венчурного фонда Antler, что было не только сильной финансовой поддержкой. Бонусом получили нетворкинг в Юго-Восточной Азии и подтверждение ценности продукта от глобального игрока.
– Ищете ли инвестиции сейчас?
Церен: – Как уже говорил, операционно прибыльны, но необходимо финансирование для скорости. Планируем привлечь около $3 млн, и нам нужен сильный лид-инвестор из США или Сингапура, который даст не только деньги, но и экспертизу, связи.
Будучи инженерами, к поиску средств подошли системно: ищем фаундеров, которые уже подняли деньги от интересных нам фондов, и выстраиваем с ними отношения. Наша цель – получить от них «теплое интро» к инвестору. В Кремниевой долине это вопрос репутации. Никто не будет рекомендовать откровенных «балбесов», чтобы не испортить свое имя. Процесс небыстрый и, скорее всего, потребует личных встреч.
«Несправедливо, что нейросети плохо говорят на казахском»
– Много ли конкурентов в мире? Чем вы от них отличаетесь?
Церен: – На рынке есть такие крупные игроки, как Scale AI, Toloka, Appen и другие компании, которые уже стоят миллиарды долларов.
Наше преимущество в подходе и фокусе. Во-первых, фокусируемся на рынках, где глобальные модели работают плохо. Во-вторых, не тратим деньги на привлечение пользователей, а приходим к людям через партнерские супераппы и говорим: «Вы едете в такси, у вас есть 15 минут. Помогите нам оценить качество кода или текста по вашей специальности и получите бонус прямо сейчас». Так моментально получаем видео и фото от тысяч пользователей.
– Каким видите проект в долгосрочной перспективе?
Церен: – Глобальная цель – построить системного инфраструктурного игрока в области данных на развивающихся рынках.
Несправедливо, что нейросети отлично понимают английский, но плохо говорят на казахском или малайском. Хотим стать платформой, к которой компании и государства будут обращаться за данными для обучения своих AI-моделей.
Қазақстандық стартапшылар GenAI үшін дерек жинаудың жаңа тәсілін тауып, $3 млн инвестиция тартып жатыр
Церен Анджукаев, Нұралы Жаңбырбаев, Дмитрий Санджиев және Артем Иванов жасанды интеллект модельдерін үйретуге қажет ауқымды материалды жылдам жинаудың жолын тауып, NCSpeech стартабын құрды. Компания қазірдің өзінде табысқа шықты. Ал сәуір айында Alem.ai Battle ұлттық AI байқауында жеңіске жетіп, Қазақстан Президенті Қасым-Жомарт Тоқаевтың қолынан марапат алды. Командаға 10 млн теңге сыйақы берілді.
Digital Business пен Astana Hub-тың бірлескен «Орталық Еуразияның 100 стартап тарихы» жобасына арнайы сұхбат берген Церен мен Дмитрий AI үшін дерек нарығы қалай жұмыс істейтінін, компанияларға неге шынайы өмірден алынған миллиондаған фото, видео және аудиожазба қажет екенін, сондай-ақ мұндай мәліметтерді такси мен жеткізу қызметі арқылы жинаудың неге ыңғайлы екенін айтып берді.
«Технарлар үшін код жазу мен B2B-сатуды қатар алып жүру оңай емес»
– NCSpeech-ті құрғанға дейін немен айналыстыңыздар?
Церен: – Менің академиялық тәжірибем бар, машиналық оқыту және AI саласында, оның ішінде дауыстық технологиялар бағытында көптен бері жұмыс істеймін. Жеке компаниялардың R&D орталықтарында зерттеу жүргізіп, ғылыми мақалалар жарияладым. Қазір олардың дәйексөз саны 500-ден асты. Сонымен қатар Артем Ивановпен бірге inDrive негізін қалаушы Арсен Томский негізін қалаған Ayta AI стартапында жұмыс істедім. Біз тұтығып сөйлейтін адамдарға арналған өнім жасадық.
Нұралы Жаңбырбаев та инженер. Ол банк секторындағы ірі корпоративтік тапсырыс берушілермен жұмыс істеп, компанияларға арналған дауыстық сервистер әзірледі.
Дмитрий Санджиев – командадағы техникалық бэкграунды жоқ жалғыз адам, бірақ кәсіпкерлік тәжірибесі мол. Бізге, технарларға, бастапқыда код жазуды B2B-сатумен және корпорациялармен байланыс орнатумен қатар алып жүру қиын болды. Бизнес саласында тәжірибесі бар Дима қосылғаннан кейін командамыз күшейе түсті.
– Стартап нақты немен айналысады?
Церен: – NCSpeech — AI әзірлеушілерге датасетті жылдам жинап, дайындауға көмектесетін B2B-платформа.
Оның маңызы қандай? Қазір алгоритм әзірлеу мен модель үйрету – шешімі табылған, тіпті үйреншікті процеске айналған дүние. AGI-ге, яғни жалпы жасанды интеллектіге жету жолындағы басты құндылықтар – сапалы оқу деректері мен есептеу қуаты. Біз дәл осы бірінші бағытпен айналысқымыз келеді.
Церен Анджукаев
– Мұндай идея қалай пайда болды?
Церен: – NCSpeech 2025 жылдың наурызында құрылды. Бірақ біз бастапқыда ірі компанияларға дайын дауыстық AI-шешімдер ұсынып бардық. Алайда келіссөздердің бәрінде қайта-қайта бір ой айтылатын: модельді үйрету қиын емес. Ең қиыны – сапалы деректерді жинау, тазалау және белгілеу.
Былтыр Нұралы бұл мәселені банктердің мысалында анық көрсетті. Оларға жабық AI-шешімдер қажет, себебі құпиялылық саясатына байланысты клиенттердің деректерін API арқылы OpenAI немесе Google жүйелеріне жібере алмайды. Тіпті жібере алған күннің өзінде, жаһандық модельдер қазақ тілінде, әсіресе қазақ және орыс тілін араластырып сөйлегенде нашар жұмыс істейді. Ал дауыстық сервис жергілікті тілді, акцент, диалект және күнделікті сөйлеу мәнерін дұрыс түсінуі үшін алдымен тексерілген әрі белгіленген жазбалардың үлкен қоры керек.
Нұралы Жаңбырбаев мен Артем Иванов
Алдымен қазақ тіліндегі дауыстық модельдер үшін дерек жинадық. Кейін дәл осындай мәселе малай, филиппин және вьетнам тілдерінде де бар екенін көрдік. Сөйтіп біртіндеп біздің негізгі құндылығымыз бен тәжірибеміз – деректермен жұмыс істеу екенін түсіндік.
Дмитрий: – Соның нақты мысалдарының бірі – Малайзиядағы банкпен жұмыс. Олар банк қосымшасына дауыспен басқару функциясын енгізгісі келді. Бірақ Малайзияда бірнеше тіл кең тарағандықтан, жаһандық модельдер адамның не айтып тұрғанын жартылай түсінбейді.
Дмитрий Санджиев
Біз деректер жинап, сөйлемді тексеру үшін жергілікті лингвистерді тарттық және банк клиенттерін түсіне алатын жергілікті модельді үйреттік. Ол үшін өзіміздің мультиагенттік платформамызды жасадық: жүйе тапсырмаларды орындаушылар арасында бөліп, нәтижені жинайды және жұмыстың сапасын тексереді. Егер тапсырма сапасыз орындалса, жүйе ескертпесін жазып, оны қайтадан орындаушыға жібереді.
Осы тәжірибе мәселені кеңірек қарауға мүмкіндік берді: мұндай қиындықтар Оңтүстік-Шығыс және Орталық Азияда, Африкада, Таяу Шығыста, Латын Америкасында өте көп. Бұл – тілі мен мәдениеті сан алуан, бірақ жаһандық AI-датасеттерде жеткілікті деңгейде қамтылмаған елдер.
Интернеттегі ашық датасеттердің мүмкіндігі сарқылып келеді. Ұшқышсыз көлік, жеткізу роботы немесе ақылды камера жасайтын компанияларға табиғи ортадан алынған фото мен видеолар қажет. Мысалы, Шымкенттегі нақты бір көшенің қазіргі көрінісі туралы мәліметті қайдан табуға болады? Оларға жай ғана интернеттегі суреттер емес, мыңдаған жаңа кескіннен тұратын толыққанды датасет керек.
Артем Иванов
Сондықтан NCSpeech аясында команда дерек жинау бағытына басымдық береміз деп шешті. Осы идеямен олар Alem.ai Battle ұлттық AI-жобалар байқауына қатысып, стартаптар санатында бас жүлде – 10 млн теңге жеңіп алды.
Біз product-market fit-ті тапқан сияқтымыз: біздің тәжірибеміз нарыққа дәл қазір керек нәрсемен дөп келді.
«Қазақстандағы ірі суперапптың бірімен пилоттық жоба бастауға дайындалып жатырмыз»
– Деректерді қалай жинауға болады?
Дмитрий: – Қала ішінде жүретін, әрі бос уақыты бар адамдарды қайдан табуға болады? Адамдар күн сайын қолданатын ірі қосымшалар: такси, жеткізу қызметі, маркетплейстер, финтех-шешімдерден табасыз. Көбіне мұндай сервистер бір экожүйенің ішінде бірнеше қызмет қатар жұмыс істейтін қосымша – супераппқа біріктірілген.
Курьер мен жүргізуші уақыттың 30-40%-ын тапсырыс күтумен өткізеді. Ал жолаушы жолда келе жатқанда 15-20 минут телефонын қарап, әлеуметтік желіні ақтарып отырады.
Біз NCSpeech-ті осындай сервистерге енгізсек дейміз. Таксиге отырған кезде сізге «Осы сапарға 20% жеңілдік алғыңыз келе ме? Онда бірнеше тапсырманы орындаңыз» деген push-хабарлама келеді. Пайдаланушыдан алақанын суретке түсіру, қысқа селфи-видео жазу немесе мәтінді дауыстап оқу сұралуы мүмкін.
– Мұндай ақпарат кімге керек?
Дмитрий: – Биометриямен айналысатын компаниялар алақан суреті бар базаны сатып алуға дайын. Олар бір суретке бір доллар береді. Бет бейнесі бар видеолар банктер мен клиентті қашықтан растау жүйесін жасайтын компанияларға қажет. Ал жаһандық AI-компанияларға алгоритмдерін жергілікті нарыққа, тілге және қолдану сценарийіне бейімдеу үшін әр елден жиналған үлкен көлемдегі дерек керек.
– Суперапп не үшін NCSpeech-пен бірігуі қажет?
Дмитрий: – Суперапп үшін бұл – жаңа табыс көзі. Оның үстіне серіктес маркетинг бюджетiн жұмсамайды: пайдаланушыларға берілетін жеңілдік пен бонусты жиналған фото, видео немесе аудиожазбаларды сатып алатын тапсырыс беруші компания төлейді. Бұдан бөлек, қосымша AI революциясынан басқа да пайда көре алады. Мысалы, жасанды интеллект енгізіліп жатқаны туралы ақпарат компания капитализациясының өсуіне әсер етеді.
Модульді енгізуден бастап, датасеттерді тексеруге дейінгі техникалық жұмыстың бәрін өз мойнымызға аламыз.
– Компаниялар мұндай функцияны енгізуге дайын ба?
Дмитрий: – Әлемде мұндай серіктестіктің мысалдары бар. Өткен жылдың соңында Uber АҚШ пен Үндістанда жүргізушілерге бос уақытта дерек жинап, оларды белгілеуді ұсынатын жобаны іске қосты. Ал биыл наурызда АҚШ-тағы ең ірі жеткізу сервисі DoorDash «соңғы метр» туралы мәлімет жинай бастады, яғни курьер ғимарат пен мейрамхананың кіреберісін суретке түсіреді.
Қазір Қазақстандағы ірі суперапптардың бірімен пилоттық жобаны іске қосуға дайындалып жатырмыз. Негізгі бағыт – видео және аудиоматериал жинау. Сонымен қатар Оңтүстік-Шығыс Азиядағы ең ірі серіктестердің бірімен келіссөз жүргізіп жатырмыз.
«ARR көрсеткішін бірнеше миллион долларға жеткізуді жоспарлап отырмыз»
– Датасет жинау қызметі қандай компанияларға қажет?
Дмитрий: – Бірінші деңгей – Google, Meta, Anthropic секілді жаһандық алпауыттар. Оларға моделін жергілікті ортаға бейімдеу үшін орасан көп көлемде дерек қажет.
Екінші деңгей – «егемен AI» жасап жатқан мемлекеттер мен компаниялар. Бұған жабық корпоративтік жүйеде модель үйретуі керек ірі банктер де кіреді.
«ARR көрсеткішін бірнеше миллион долларға жеткізуді жоспарлап отырмыз»
– Датасет жинау қызметі қандай компанияларға қажет?
Дмитрий: – Бірінші деңгей – Google, Meta, Anthropic секілді жаһандық алпауыттар. Оларға моделін жергілікті ортаға бейімдеу үшін орасан көп көлемде дерек қажет.
Екінші деңгей – «егемен AI» жасап жатқан мемлекеттер мен компаниялар. Бұған жабық корпоративтік жүйеде модель үйретуі керек ірі банктер де кіреді.
Сондықтан ARR көрсеткішін бірнеше миллион долларға тез жеткіземіз деп отырмыз. Қазір AI үшін дерек жинау және белгілеу нарығы әлем бойынша $3,8 млрд деп бағаланады. Болжам бойынша, бірнеше жылдан кейін бұл көрсеткіш 10 миллиард доллардан асады.
– Бұл нарықта қандай шектеулер бар?
Церен: – Заңсыз қызметпен немесе санкцияға іліккен компаниялармен мүлде жұмыс істемейміз.
Бір қытайлық компания екі жасқа дейінгі ұйықтап жатқан балалардың фото және видеосын жинауды сұрады. Бәлкім, «ақылды бейнебақылаушы» алгоритмін үйрету үшін керек болған шығар. Бірақ оны тексеру мүмкін болмағандықтан, бас тарттық.
Дмитрий: – Жеке деректерді қорғау туралы заңдарды қатаң сақтаймыз. Біріншіден, тапсырманы адамдардың құпия мәліметтері берілмейтіндей етіп құрамыз. Мысалы, егер дауыс жазбасы керек болса, пайдаланушыдан төлқұжат нөмірін айтуды емес, ауа райы туралы айтып беруді сұраймыз.
Екіншіден, фото немесе видеоға көшедегі бөгде адамдардың беті не көлік нөмірі түсіп қалса, олар тапсырыс берушіге жіберілер алдында автоматты түрде бұлыңғырланып немесе қиылып тасталады.
Жалпы, дерек жинау толықтай ерікті түрде жүреді: тапсырманы орындамас бұрын пайдаланушы келісімге қол қояды, онда деректің не үшін жиналатыны нақты көрсетіледі. Егер адамға жайсыз болса, тапсырманы орындамай-ақ қоя алады.
Нуралы Жанбырбаев
«АҚШ немесе Сингапурдан мықты лид-инвестор тартып, шамамен $3 млн инвестиция тартқымыз келеді»
– Жоба қазір қай кезеңде?
Церен: – Ауқымды кеңейтіп жатырмыз: жоба табыс әкеледі және өзін өзі ақтап тұр. Енді команданы үлкейтуіміз керек, мықты продакт-мамандарды, инженерлерді, сатумен айналысатын мамандарды жұмысқа алу қажет.
– NCSpeech-ке осы уақытқа дейін қанша қаржы салдыңыздар?
Церен: – Алғашқы жарты жыл жобаны толықтай өз қалтамыздан қаржыландырдық. Ешкім жалақы алған жоқ. Нарықта біздің әр инженердің айлық құны кемінде $5 мың тұрады. Сол кезде AWS пен Google Cloud бағдарламалары аясындағы бұлтты инфрақұрылым гранттары көп көмектесті. Сонымен қатар NCSpeech – Astana Hub резиденті, сондықтан салықтық жеңілдіктер алады.
Жазда Сингапурдағы Antler венчурлық қорынан $110 мың инвестиция тарттық. Бұл тек қаржылай қолдау ғана емес еді. Қоса берілген бонус ретінде Оңтүстік-Шығыс Азиядағы нетворкке жол ашылып, біздің өнімнің құндылығын жаһандық ойыншы растады.
– Қазір инвестиция іздеп жүрсіздер ме?
Церен: – Жоғарыда айтқанымдай, операциялық жағынан табысқа шықтық. Бірақ жылдам өсу үшін қосымша қаржы керек. Шамамен $3 млн тартуды жоспарлап отырмыз. Бізге АҚШ немесе Сингапурдан тек ақша емес, тәжірибе мен байланыс әкелетін мықты лид-инвестор қажет.
Инженер болғандықтан, инвестиция іздеуге де жүйелі қарадық: бізге қызық қорлардан қаржы алған фаундерлерді тауып, олармен байланыс орнатып жатырмыз. Мақсатымыз – инвесторға сенімді адам арқылы шығу. Кремний алқабында бұл – бедел мәселесі. Ешкім өз атына нұқсан келтірмеу үшін біліксіз адамдарды ұсынбайды. Бұл ұзақ процесс, әрі жеке кездесулерді қажет етуі мүмкін.
«Нейрожелілердің қазақша дұрыс сөйлемейтіні әділетсіз»
– Әлемде бәсекелестер көп пе? Сіздердің ерекшеліктеріңіз қандай?
Церен: – Нарықта Scale AI, Toloka, Appen секілді миллиардтаған долларға бағаланатын ірі ойыншылар бар.
Біздің артықшылығымыз – тәсіл мен фокусымызда. Біріншіден, жаһандық модельдер нашар жұмыс істейтін нарықтарға басымдық береміз. Екіншіден, пайдаланушы тартуға ақша шашпаймыз. Біз адамдарға серіктес суперапптар арқылы жетеміз де: «Сіз таксиде кетіп бара жатырсыз, 15 минутыңыз бар. Өз мамандығыңыз бойынша кодтың немесе мәтіннің сапасын бағалауға көмектесіңіз, есесіне бірден бонус аласыз», – дейміз. Осылайша мыңдаған пайдаланушыдан фото мен видеоны жылдам жинаймыз.
– Жобаны ұзақ мерзімде қалай елестетесіздер?
Церен: – Басты мақсатымыз – дамушы нарықтардағы дерек саласында жүйелі инфрақұрылымдық ойыншыға айналу.
Нейрожелілердің ағылшын тілін жақсы түсініп, ал қазақша не малайшаға келгенде нашар сөйлеуі – әділетсіз. Біз компаниялар мен мемлекеттер AI-модельдерін үйретуге қажет деректер үшін жүгінетін платформаға айналғымыз келеді.
Kazakhstani Startup Finds a Smarter Way to Collect Data for GenAI and Is Raising $3M
Tseren Andzhukayev, Nuraly Zhanbyrbayev, Dmitry Sandzhiyev, and Artem Ivanov figured out a way to quickly collect large amounts of data for training AI models, and went on to launch NCSpeech. The company is already profitable. In April, it also won Alem.ai Battle, Kazakhstan’s national AI competition. The team received the award from President Kassym-Jomart Tokayev himself and took home a 10 million tenge prize.
For the joint Digital Business and Astana Hub project, 100 Startup Stories from Central Eurasia, Tseren and Dmitry explained how the AI data market works, why companies need millions of real-life photos, videos, and audio recordings, and why taxis and delivery services are such a convenient way to collect them.
“Tech people often find it hard to juggle coding and B2B sales”
– What were you doing before founding NCSpeech?
Tseren: – I come from an academic background and have been working in machine learning and AI for a long time, including voice technologies. I did research at R&D centers for private companies and published academic papers, which now have more than 500 citations. I also worked with Artem Ivanov at Ayta AI, a startup founded by inDrive founder Arsen Tomsky. We were building a product for people who stutter.
Nuraly Zhanbyrbayev is also an engineer. He worked with major corporate clients in the banking sector and built voice services for companies.
Dmitry Sandzhiyev is the only team member without a technical background, but he brings a lot of entrepreneurial experience. For us tech people, it was tough at the beginning to juggle coding, B2B sales, and building relationships with corporations. When Dima joined with his business expertise, it made the team much stronger.
– What exactly is the startup building?
Tseren: – NCSpeech is a B2B platform that helps AI developers quickly collect and prepare datasets.
Why does that matter? Today, building algorithms and training models has become a solvable, almost routine task. The real value on the path to AGI, or artificial general intelligence, is high-quality training data and computing power. We want to focus on the first part: data.
Tseren Andzhukayev
– Where did the idea come from?
Tseren: – We started NCSpeech in March 2025, but at first, we were going to large companies with ready-made voice AI solutions. But in negotiations, we kept hearing the same thing: training the model wasn’t the main problem. The much harder part was collecting, cleaning, and labeling high-quality data.
Last year, Nuraly explained the problem really well using banks as an example. Banks need closed AI solutions because, due to privacy policies, they can’t send customer data through APIs to OpenAI or Google. But even if they could, global models still don’t work that well with Kazakh, especially when people mix Kazakh and Russian. For a voice service to properly understand the local language, accents, dialects, and natural everyday speech, you first need a large volume of verified and labeled recordings.
Nuraly Zhanbyrbayev and Artem Ivanov
We collected that kind of data for Kazakh-language voice models, and later ran into similar challenges with Malay, Filipino, and Vietnamese. That’s how we gradually realized that our real value and expertise were in working with data.
Dmitry: – One good example is a case with a Malaysian bank. They wanted to add voice controls to their banking app. But because several languages are widely spoken in Malaysia, global models fail to understand what users are saying about half the time.
Dmitry Sandzhiyev
We collected the data, brought in local linguists to check the phrases, and trained a local model that could actually understand the bank’s customers. To make it work, we built our own multi-agent platform. It assigns tasks to contributors, collects the results, and checks the quality of the work. If the system sees that a task was done poorly, it sends it back to the contributor with comments.
That story helped us see the bigger picture: there are plenty of similar problems across Southeast and Central Asia, Africa, the Middle East, and Latin America. These are regions with a huge number of languages and cultures that are still underrepresented in global AI datasets.
At the same time, public datasets online have pretty much been exhausted. Companies building self-driving cars, delivery robots, or smart cameras need photos and videos from real-life environments. For example, where do you find data on what a specific street in Shymkent actually looks like? You don’t just need random images from open sources. You need a proper dataset, thousands of fresh, up-to-date images.
Artem Ivanov
So with NCSpeech, we decided to focus on data collection. That was the idea the team took to Alem.ai Battle, the national AI project competition. In the startup category, NCSpeech won the top prize of 10 million tenge.
It feels like we’ve found product-market fit: our expertise lines up perfectly with what the market needs.
“We’re getting ready to launch a pilot with a major super app in Kazakhstan”
– How can you collect data?
Dmitry: – Where do you find people who are out in real city environments and also have some free time? In the big apps people already use every day: taxi, delivery, marketplaces, fintech products. Often, these services are bundled into super apps, where several services are available inside one ecosystem.
Couriers and drivers spend 30-40% of their time waiting for an order, while passengers spend 15-20 minutes on their phones during a ride, scrolling through social media.
Our idea is to integrate NCSpeech into services like that. For example, when you get into a taxi, you receive a push notification: “Want 20% off this ride? Complete a couple of tasks.” The user might be asked to take a photo of their palm, record a short selfie video, or dictate a piece of text.
– Who needs this kind of data?
Dmitry: – Companies working in biometrics are willing to buy datasets with palm photos, at around one dollar per image. Banks and developers of remote customer verification tools need face videos. And global AI companies need massive amounts of data from different countries so they can adapt their algorithms to local markets, languages, and real-life use cases.
– Why would super apps want to integrate with NCSpeech?
Dmitry: – For a super app, it’s a new revenue stream. And the partner doesn’t have to spend its own marketing budget on it: the discounts and bonuses for users are covered by the customer, the company buying the collected photos, videos, or audio recordings. On top of that, the app can benefit from the AI boom in other ways too. For example, simply showing that it is integrating AI can help increase the company’s valuation.
We handle the entire technical side, from integrating the module to verifying the datasets.
– Are companies willing to build this kind of feature into their apps?
Dmitry: – There are already examples of this kind of collaboration globally. Late last year, Uber launched a project in the US and India where drivers were offered data collection and labeling tasks during downtime. In March this year, DoorDash, the largest delivery company in the US, launched data collection around the “last meter”: its couriers take photos of building or restaurant entrances.
We’re now getting ready to launch a pilot with a major super app in Kazakhstan. The focus will be on collecting video and audio materials. We’re also in talks with a major partner in Southeast Asia.
“We expect to hit several million dollars in ARR pretty quickly”
– What kinds of companies need dataset collection services?
Dmitry: – The first tier is the global giants, like Google, Meta, and Anthropic, that need massive amounts of data to adapt their models to local realities.
The second tier is companies and governments building sovereign AI. This also includes major banks that need to train models inside a closed corporate environment.
Finally, specific datasets are also needed by startups that have raised funding to build niche AI services.
Today, we have several clients in Kazakhstan and Southeast Asia. Most of them are banks, financial institutions, and AI labs within large holdings.
– How much does it cost?
Tseren: – Collecting data is expensive. Project budgets start at tens of thousands of dollars, which is basically the minimum where projects like this even make sense.
That’s why we expect to reach several million dollars in ARR fairly quickly. The global market for AI data collection and labeling is currently estimated at $3.8 billion, and forecasts suggest it will exceed $10 billion in the next few years.
– What are the limitations in this market?
Tseren: – We don’t work with anything illegal or with companies under sanctions.
One Chinese company once asked us to collect photos and videos of sleeping children under the age of two, probably to train algorithms for a smart baby monitor. But since we couldn’t verify that, we turned it down.
Dmitry: – We strictly follow personal data protection laws. First, we design the tasks in a way that avoids collecting sensitive personal information. For example, if we need a voice recording, we might ask users to talk about the weather, not say their passport number.
Second, if random passersby’s faces or license plates appear in a photo or video, they’re automatically blurred or removed before the data is sent to the client.
And overall, the whole data collection process is completely voluntary. Before completing a task, the user signs an agreement that clearly explains why the data is being collected. If someone isn’t comfortable with it, they can simply skip the task.
Нуралы Жанбырбаев
“We want to raise around $3M from a strong lead investor in the US or Singapore”
– What stage is the project at now?
Tseren: – We’re actively scaling now. The project is already generating revenue and paying for itself. Now we need to grow the team by hiring strong product people, engineers, and sales specialists.
– How much have you already invested in NCSpeech?
Tseren: – For the first six months, we funded the project entirely out of our own pockets. No one was taking a salary, even though each of our engineers would be worth at least $5,000 a month on the market. During that period, AWS and Google Cloud cloud infrastructure grants really helped us. NCSpeech is also a resident of Astana Hub and receives tax benefits.
That summer, we raised $110,000 from Antler, a Singapore-based VC fund. And it wasn’t just about the money. We also got access to a strong network in Southeast Asia and, just as importantly, validation from a global player that the product really has value.
– Are you looking for investment right now?
Tseren: – As I mentioned, we’re already profitable operationally, but we need funding to move faster. We’re planning to raise around $3 million, and we’re looking for a strong lead investor from the US or Singapore who can bring more than just money, someone with real expertise and connections.
As engineers, we approached fundraising in a pretty systematic way. We look for founders who have already raised money from the funds we’re interested in, and then start building relationships with them. The goal is to get a warm intro to the investor. In Silicon Valley, that’s a reputation game. No one is going to recommend someone who clearly isn’t serious, because it could damage their own name. It’s not a quick process, and most likely, it will take in-person meetings too.
“It’s unfair that AI still doesn’t speak Kazakh well”
– Are there many competitors globally? And what makes you different?
Tseren: – There are big players in this market, like Scale AI, Toloka, Appen, and other companies already worth billions of dollars.
Our edge is in our approach and focus. First, we focus on markets where global models don’t work well. Second, we don’t spend money on user acquisition. Instead, we reach people through partner super apps and say: “You’re in a taxi, you have 15 minutes. Help us evaluate the quality of code or text in your field and get a bonus right away.” That way, we can instantly collect videos and photos from thousands of users.
– How do you see the project in the long run?
Tseren: – The big goal is to build a serious infrastructure player in data for emerging markets.
It’s not fair that AI models can understand English so well, but still struggle with languages like Kazakh or Malay. We want to become the go-to platform that companies and governments turn to when they need data to train their AI models.