Церен Анджукаев, Нұралы Жаңбырбаев, Дмитрий Санджиев және Артем Иванов жасанды интеллект модельдерін үйретуге қажет ауқымды материалды жылдам жинаудың жолын тауып, NCSpeech стартабын құрды. Компания қазірдің өзінде табысқа шықты. Ал сәуір айында Alem.ai Battle ұлттық AI байқауында жеңіске жетіп, Қазақстан Президенті Қасым-Жомарт Тоқаевтың қолынан марапат алды. Командаға 10 млн теңге сыйақы берілді.
Digital Business пен Astana Hub-тың бірлескен «Орталық Еуразияның 100 стартап тарихы» жобасына арнайы сұхбат берген Церен мен Дмитрий AI үшін дерек нарығы қалай жұмыс істейтінін, компанияларға неге шынайы өмірден алынған миллиондаған фото, видео және аудиожазба қажет екенін, сондай-ақ мұндай мәліметтерді такси мен жеткізу қызметі арқылы жинаудың неге ыңғайлы екенін айтып берді.
«Технарлар үшін код жазу мен B2B-сатуды қатар алып жүру оңай емес»
– NCSpeech-ті құрғанға дейін немен айналыстыңыздар?
Церен: – Менің академиялық тәжірибем бар, машиналық оқыту және AI саласында, оның ішінде дауыстық технологиялар бағытында көптен бері жұмыс істеймін. Жеке компаниялардың R&D орталықтарында зерттеу жүргізіп, ғылыми мақалалар жарияладым. Қазір олардың дәйексөз саны 500-ден асты. Сонымен қатар Артем Ивановпен бірге inDrive негізін қалаушы Арсен Томский негізін қалаған Ayta AI стартапында жұмыс істедім. Біз тұтығып сөйлейтін адамдарға арналған өнім жасадық.
Нұралы Жаңбырбаев та инженер. Ол банк секторындағы ірі корпоративтік тапсырыс берушілермен жұмыс істеп, компанияларға арналған дауыстық сервистер әзірледі.
Дмитрий Санджиев – командадағы техникалық бэкграунды жоқ жалғыз адам, бірақ кәсіпкерлік тәжірибесі мол. Бізге, технарларға, бастапқыда код жазуды B2B-сатумен және корпорациялармен байланыс орнатумен қатар алып жүру қиын болды. Бизнес саласында тәжірибесі бар Дима қосылғаннан кейін командамыз күшейе түсті.
– Стартап нақты немен айналысады?
Церен: – NCSpeech — AI әзірлеушілерге датасетті жылдам жинап, дайындауға көмектесетін B2B-платформа.
Оның маңызы қандай? Қазір алгоритм әзірлеу мен модель үйрету – шешімі табылған, тіпті үйреншікті процеске айналған дүние. AGI-ге, яғни жалпы жасанды интеллектіге жету жолындағы басты құндылықтар – сапалы оқу деректері мен есептеу қуаты. Біз дәл осы бірінші бағытпен айналысқымыз келеді.
Церен Анджукаев
– Мұндай идея қалай пайда болды?
Церен: – NCSpeech 2025 жылдың наурызында құрылды. Бірақ біз бастапқыда ірі компанияларға дайын дауыстық AI-шешімдер ұсынып бардық. Алайда келіссөздердің бәрінде қайта-қайта бір ой айтылатын: модельді үйрету қиын емес. Ең қиыны – сапалы деректерді жинау, тазалау және белгілеу.
Былтыр Нұралы бұл мәселені банктердің мысалында анық көрсетті. Оларға жабық AI-шешімдер қажет, себебі құпиялылық саясатына байланысты клиенттердің деректерін API арқылы OpenAI немесе Google жүйелеріне жібере алмайды. Тіпті жібере алған күннің өзінде, жаһандық модельдер қазақ тілінде, әсіресе қазақ және орыс тілін араластырып сөйлегенде нашар жұмыс істейді. Ал дауыстық сервис жергілікті тілді, акцент, диалект және күнделікті сөйлеу мәнерін дұрыс түсінуі үшін алдымен тексерілген әрі белгіленген жазбалардың үлкен қоры керек.
Нұралы Жаңбырбаев мен Артем Иванов
Алдымен қазақ тіліндегі дауыстық модельдер үшін дерек жинадық. Кейін дәл осындай мәселе малай, филиппин және вьетнам тілдерінде де бар екенін көрдік. Сөйтіп біртіндеп біздің негізгі құндылығымыз бен тәжірибеміз – деректермен жұмыс істеу екенін түсіндік.
Дмитрий: – Соның нақты мысалдарының бірі – Малайзиядағы банкпен жұмыс. Олар банк қосымшасына дауыспен басқару функциясын енгізгісі келді. Бірақ Малайзияда бірнеше тіл кең тарағандықтан, жаһандық модельдер адамның не айтып тұрғанын жартылай түсінбейді.
Дмитрий Санджиев
Біз деректер жинап, сөйлемді тексеру үшін жергілікті лингвистерді тарттық және банк клиенттерін түсіне алатын жергілікті модельді үйреттік. Ол үшін өзіміздің мультиагенттік платформамызды жасадық: жүйе тапсырмаларды орындаушылар арасында бөліп, нәтижені жинайды және жұмыстың сапасын тексереді. Егер тапсырма сапасыз орындалса, жүйе ескертпесін жазып, оны қайтадан орындаушыға жібереді.
Осы тәжірибе мәселені кеңірек қарауға мүмкіндік берді: мұндай қиындықтар Оңтүстік-Шығыс және Орталық Азияда, Африкада, Таяу Шығыста, Латын Америкасында өте көп. Бұл – тілі мен мәдениеті сан алуан, бірақ жаһандық AI-датасеттерде жеткілікті деңгейде қамтылмаған елдер.
Интернеттегі ашық датасеттердің мүмкіндігі сарқылып келеді. Ұшқышсыз көлік, жеткізу роботы немесе ақылды камера жасайтын компанияларға табиғи ортадан алынған фото мен видеолар қажет. Мысалы, Шымкенттегі нақты бір көшенің қазіргі көрінісі туралы мәліметті қайдан табуға болады? Оларға жай ғана интернеттегі суреттер емес, мыңдаған жаңа кескіннен тұратын толыққанды датасет керек.
Артем Иванов
Сондықтан NCSpeech аясында команда дерек жинау бағытына басымдық береміз деп шешті. Осы идеямен олар Alem.ai Battle ұлттық AI-жобалар байқауына қатысып, стартаптар санатында бас жүлде – 10 млн теңге жеңіп алды.
Біз product-market fit-ті тапқан сияқтымыз: біздің тәжірибеміз нарыққа дәл қазір керек нәрсемен дөп келді.
«Қазақстандағы ірі суперапптың бірімен пилоттық жоба бастауға дайындалып жатырмыз»
– Деректерді қалай жинауға болады?
Дмитрий: – Қала ішінде жүретін, әрі бос уақыты бар адамдарды қайдан табуға болады? Адамдар күн сайын қолданатын ірі қосымшалар: такси, жеткізу қызметі, маркетплейстер, финтех-шешімдерден табасыз. Көбіне мұндай сервистер бір экожүйенің ішінде бірнеше қызмет қатар жұмыс істейтін қосымша – супераппқа біріктірілген.
Курьер мен жүргізуші уақыттың 30-40%-ын тапсырыс күтумен өткізеді. Ал жолаушы жолда келе жатқанда 15-20 минут телефонын қарап, әлеуметтік желіні ақтарып отырады.
Біз NCSpeech-ті осындай сервистерге енгізсек дейміз. Таксиге отырған кезде сізге «Осы сапарға 20% жеңілдік алғыңыз келе ме? Онда бірнеше тапсырманы орындаңыз» деген push-хабарлама келеді. Пайдаланушыдан алақанын суретке түсіру, қысқа селфи-видео жазу немесе мәтінді дауыстап оқу сұралуы мүмкін.
– Мұндай ақпарат кімге керек?
Дмитрий: – Биометриямен айналысатын компаниялар алақан суреті бар базаны сатып алуға дайын. Олар бір суретке бір доллар береді. Бет бейнесі бар видеолар банктер мен клиентті қашықтан растау жүйесін жасайтын компанияларға қажет. Ал жаһандық AI-компанияларға алгоритмдерін жергілікті нарыққа, тілге және қолдану сценарийіне бейімдеу үшін әр елден жиналған үлкен көлемдегі дерек керек.
– Суперапп не үшін NCSpeech-пен бірігуі қажет?
Дмитрий: – Суперапп үшін бұл – жаңа табыс көзі. Оның үстіне серіктес маркетинг бюджетiн жұмсамайды: пайдаланушыларға берілетін жеңілдік пен бонусты жиналған фото, видео немесе аудиожазбаларды сатып алатын тапсырыс беруші компания төлейді. Бұдан бөлек, қосымша AI революциясынан басқа да пайда көре алады. Мысалы, жасанды интеллект енгізіліп жатқаны туралы ақпарат компания капитализациясының өсуіне әсер етеді.
Модульді енгізуден бастап, датасеттерді тексеруге дейінгі техникалық жұмыстың бәрін өз мойнымызға аламыз.
– Компаниялар мұндай функцияны енгізуге дайын ба?
Дмитрий: – Әлемде мұндай серіктестіктің мысалдары бар. Өткен жылдың соңында Uber АҚШ пен Үндістанда жүргізушілерге бос уақытта дерек жинап, оларды белгілеуді ұсынатын жобаны іске қосты. Ал биыл наурызда АҚШ-тағы ең ірі жеткізу сервисі DoorDash «соңғы метр» туралы мәлімет жинай бастады, яғни курьер ғимарат пен мейрамхананың кіреберісін суретке түсіреді.
Қазір Қазақстандағы ірі суперапптардың бірімен пилоттық жобаны іске қосуға дайындалып жатырмыз. Негізгі бағыт – видео және аудиоматериал жинау. Сонымен қатар Оңтүстік-Шығыс Азиядағы ең ірі серіктестердің бірімен келіссөз жүргізіп жатырмыз.
«ARR көрсеткішін бірнеше миллион долларға жеткізуді жоспарлап отырмыз»
– Датасет жинау қызметі қандай компанияларға қажет?
Дмитрий: – Бірінші деңгей – Google, Meta, Anthropic секілді жаһандық алпауыттар. Оларға моделін жергілікті ортаға бейімдеу үшін орасан көп көлемде дерек қажет.
Екінші деңгей – «егемен AI» жасап жатқан мемлекеттер мен компаниялар. Бұған жабық корпоративтік жүйеде модель үйретуі керек ірі банктер де кіреді.
«ARR көрсеткішін бірнеше миллион долларға жеткізуді жоспарлап отырмыз»
– Датасет жинау қызметі қандай компанияларға қажет?
Дмитрий: – Бірінші деңгей – Google, Meta, Anthropic секілді жаһандық алпауыттар. Оларға моделін жергілікті ортаға бейімдеу үшін орасан көп көлемде дерек қажет.
Екінші деңгей – «егемен AI» жасап жатқан мемлекеттер мен компаниялар. Бұған жабық корпоративтік жүйеде модель үйретуі керек ірі банктер де кіреді.
Сондықтан ARR көрсеткішін бірнеше миллион долларға тез жеткіземіз деп отырмыз. Қазір AI үшін дерек жинау және белгілеу нарығы әлем бойынша $3,8 млрд деп бағаланады. Болжам бойынша, бірнеше жылдан кейін бұл көрсеткіш 10 миллиард доллардан асады.
– Бұл нарықта қандай шектеулер бар?
Церен: – Заңсыз қызметпен немесе санкцияға іліккен компаниялармен мүлде жұмыс істемейміз.
Бір қытайлық компания екі жасқа дейінгі ұйықтап жатқан балалардың фото және видеосын жинауды сұрады. Бәлкім, «ақылды бейнебақылаушы» алгоритмін үйрету үшін керек болған шығар. Бірақ оны тексеру мүмкін болмағандықтан, бас тарттық.
Дмитрий: – Жеке деректерді қорғау туралы заңдарды қатаң сақтаймыз. Біріншіден, тапсырманы адамдардың құпия мәліметтері берілмейтіндей етіп құрамыз. Мысалы, егер дауыс жазбасы керек болса, пайдаланушыдан төлқұжат нөмірін айтуды емес, ауа райы туралы айтып беруді сұраймыз.
Екіншіден, фото немесе видеоға көшедегі бөгде адамдардың беті не көлік нөмірі түсіп қалса, олар тапсырыс берушіге жіберілер алдында автоматты түрде бұлыңғырланып немесе қиылып тасталады.
Жалпы, дерек жинау толықтай ерікті түрде жүреді: тапсырманы орындамас бұрын пайдаланушы келісімге қол қояды, онда деректің не үшін жиналатыны нақты көрсетіледі. Егер адамға жайсыз болса, тапсырманы орындамай-ақ қоя алады.
Нуралы Жанбырбаев
«АҚШ немесе Сингапурдан мықты лид-инвестор тартып, шамамен $3 млн инвестиция тартқымыз келеді»
– Жоба қазір қай кезеңде?
Церен: – Ауқымды кеңейтіп жатырмыз: жоба табыс әкеледі және өзін өзі ақтап тұр. Енді команданы үлкейтуіміз керек, мықты продакт-мамандарды, инженерлерді, сатумен айналысатын мамандарды жұмысқа алу қажет.
– NCSpeech-ке осы уақытқа дейін қанша қаржы салдыңыздар?
Церен: – Алғашқы жарты жыл жобаны толықтай өз қалтамыздан қаржыландырдық. Ешкім жалақы алған жоқ. Нарықта біздің әр инженердің айлық құны кемінде $5 мың тұрады. Сол кезде AWS пен Google Cloud бағдарламалары аясындағы бұлтты инфрақұрылым гранттары көп көмектесті. Сонымен қатар NCSpeech – Astana Hub резиденті, сондықтан салықтық жеңілдіктер алады.
Жазда Сингапурдағы Antler венчурлық қорынан $110 мың инвестиция тарттық. Бұл тек қаржылай қолдау ғана емес еді. Қоса берілген бонус ретінде Оңтүстік-Шығыс Азиядағы нетворкке жол ашылып, біздің өнімнің құндылығын жаһандық ойыншы растады.
– Қазір инвестиция іздеп жүрсіздер ме?
Церен: – Жоғарыда айтқанымдай, операциялық жағынан табысқа шықтық. Бірақ жылдам өсу үшін қосымша қаржы керек. Шамамен $3 млн тартуды жоспарлап отырмыз. Бізге АҚШ немесе Сингапурдан тек ақша емес, тәжірибе мен байланыс әкелетін мықты лид-инвестор қажет.
Инженер болғандықтан, инвестиция іздеуге де жүйелі қарадық: бізге қызық қорлардан қаржы алған фаундерлерді тауып, олармен байланыс орнатып жатырмыз. Мақсатымыз – инвесторға сенімді адам арқылы шығу. Кремний алқабында бұл – бедел мәселесі. Ешкім өз атына нұқсан келтірмеу үшін біліксіз адамдарды ұсынбайды. Бұл ұзақ процесс, әрі жеке кездесулерді қажет етуі мүмкін.
«Нейрожелілердің қазақша дұрыс сөйлемейтіні әділетсіз»
– Әлемде бәсекелестер көп пе? Сіздердің ерекшеліктеріңіз қандай?
Церен: – Нарықта Scale AI, Toloka, Appen секілді миллиардтаған долларға бағаланатын ірі ойыншылар бар.
Біздің артықшылығымыз – тәсіл мен фокусымызда. Біріншіден, жаһандық модельдер нашар жұмыс істейтін нарықтарға басымдық береміз. Екіншіден, пайдаланушы тартуға ақша шашпаймыз. Біз адамдарға серіктес суперапптар арқылы жетеміз де: «Сіз таксиде кетіп бара жатырсыз, 15 минутыңыз бар. Өз мамандығыңыз бойынша кодтың немесе мәтіннің сапасын бағалауға көмектесіңіз, есесіне бірден бонус аласыз», – дейміз. Осылайша мыңдаған пайдаланушыдан фото мен видеоны жылдам жинаймыз.
– Жобаны ұзақ мерзімде қалай елестетесіздер?
Церен: – Басты мақсатымыз – дамушы нарықтардағы дерек саласында жүйелі инфрақұрылымдық ойыншыға айналу.
Нейрожелілердің ағылшын тілін жақсы түсініп, ал қазақша не малайшаға келгенде нашар сөйлеуі – әділетсіз. Біз компаниялар мен мемлекеттер AI-модельдерін үйретуге қажет деректер үшін жүгінетін платформаға айналғымыз келеді.