Казахстанцы придумали голосовых роботов, похожих на людей. Вот как работает технология

О редакции Топ-10 казахстанских стартапов по версии Digital Business
Дата публикации: 27.01.2025, 08:54
Основатели CyberNet AI Рашид Исмаилов, Виталий Акулов и Иван Белохвостиков

Основатели CyberNet AI Рашид Исмаилов, Виталий Акулов и Иван Белохвостиков

Искусственный интеллект, по мнению многих экспертов, произведет в нашей жизни более значительную революцию, чем любая другая технология. По  прогнозам Sequoia Capital, следующие 10 лет пройдут под знаком AI-агентов. Стартап CyberNet AI, который занимается созданием голосовых роботов на основе ИИ, – часть этой трансформации. Казахстанским решением уже пользуются крупные компании в пяти странах.

Основатели проекта Иван Белохвостиков, Виталий Акулов и Рашид Исмаилов, а также руководитель по центральноазиатскому региону Данияр Омурзаков рассказали Digital Business о том, насколько эффективно голосовые роботы справляются с задачами финансовых и телеком-компаний, в каких ситуациях предпочтительнее женские голоса, а в каких – мужские. Также поговорили о перспективах развития  стартапа на зарубежных рынках и экспансии в США.

«Основная задача – обучить роботов, чтобы их речь не отличалась от человеческой»

Иван, Виталий и Рашид знакомы давно. До запуска собственного стартапа они много лет работали в крупнейших банках Казахстана, Европы и США. Именно там, создавая цифровые проекты, ребята смогли оценить потенциал AI. Им быстро стало ясно, что за этой технологией будущее, так как она практически не имеет ограничений в возможностях. Так 3 года назад родилась идея CyberNet AI.

Иван Белохвостиков

Иван Белохвостиков

«Изначально делали все сами. Благо бэкграунд позволял. Я в свое время защитил диссертацию по computer science на тему «Системные исследования и оптимизация функционирования интернет-систем с использованием сетей Петри (предвестники нейросетей – прим. Digital Business)». Рашид – гениальный разработчик, который добирался до полуфинала чемпионата мира по программированию. Виталий начинал свою карьеру в американском Citibank. Там он занимался проектами, связанными с развитием клиентов из МСБ-сегмента.

Сегодня наш главный продукт – голосовые роботы AIDOS (Artificial Intelligence Dialog Operating System) для решения проблем, которые у компаний, особенно в финансовом секторе, похожи. Сегодня для качественного общения с клиентами нужны огромные контакт-центры и сотни людей. А в таких сложных направлениях, как возврат задолженностей или телемаркетинг, работа операторов требует еще и эмоциональной устойчивости. Мы увидели, что искусственный интеллект уже достиг уровня, при котором может решать задачи наравне с людьми, а часто даже лучше. В результате начали создавать цифровые контакт-центры, которые дешевле традиционных и значительно эффективнее.

CyberNet AI

Логика работы онлайн-робота во многом напоминает человека. Он «слушает» с помощью моделей ASR (Automatic Speech Recognition), которые преобразуют речь в текст. Затем информацию «обрабатывает мозг» – в этом помогают NLU или LLM, анализирующие текст, понимающие его смысл и формирующие ответ по заданной логике. Когда все готово, робот «говорит» через TTS (Text-to-Speech), преобразуя текст в голос. Основная задача – обучить модели так, чтобы их речь звучала естественно, а скорость общения не отличалась от человеческой даже при миллионах коммуникаций», – рассказывает Иван Белохвостиков.

«Никто не хочет общаться с машиной – все хотят разговаривать с человеком»

Главным конкурентным преимуществом в CyberNet AI считают собственную разработку, акцент на безопасности данных и возможность протестировать бесплатный пилот, который создается индивидуально под каждого заказчика.

«Большинство решений для распознавания и синтеза речи используют внешние сервисы, однако мы сделали ставку на закрытый контур, где данные остаются внутри страны. Такой подход оказался очень востребованным. Когда запускались, этого просто не было на рынке, и многие конкуренты до сих пор работают через внешние сервисы», – делится Рашид Исмаилов.

Рашид Исмаилов

Рашид Исмаилов

«Мы предлагаем партнерам бесплатный пилотный проект и даем возможность посмотреть на реальный результат. Они тестируют наши решения, сравнивают эффективность своего контакт-центра и AI, смотрят на цифры. Когда наши роботы выигрывают, вопроса о внедрении больше не возникает. После таких пилотов конверсия в подписанные договора более 95%», – добавляет Виталий Акулов.

К числу преимуществ также можно отнести использование SaaS-моделей, которые экономят клиентам время и деньги, а также делают их гибкими. Фактически мы даем возможность нанимать цифровых сотрудников и ежемесячно платить за них. Пример: партнер на весь 2024-й год расширил свой контакт-центр на 120 наших AI-агентов. Один AI-агент обходится дешевле на 254 тысячи тенге в месяц, чем новый сотрудник. Получается, за год удается сэкономить 365,7 млн тенге.

Виталий Акулов

Виталий Акулов

Также важно отметить, что пользователям CyberNet AI не нужно покупать оборудование для контакт-центров, нанимать и обучать сотрудников, арендовать помещения. Они платят только за фактическое использование, а мощность можно увеличивать или снижать в зависимости от нагрузки. Размещение облака в ЦОДах, которые используют крупнейшие финансовые институты, гарантирует надежность и максимальную безопасность.

«Мы работаем на огромных объемах, обеспечивая ежедневное взаимодействие с сотнями тысяч людей. В пиковые дни наш сервис обрабатывает по 300 тысяч коммуникаций. Одна из ключевых задач – минимизировать latency (задержку ответа), чтобы собеседник не понял, что говорит с роботом. Никто не хочет общаться с машиной – все хотят разговаривать с человеком.

Цель – сделать речь робота максимально естественной. Особенность наших технологий – мультиязыковые модели. Один и тот же голос может говорить, например, на казахском и русском, переключаясь между ними в рамках одного диалога. Также партнер может предоставить пример понравившегося голоса, а мы синтезируем их для робота, адаптируя под индивидуальный запрос», – объясняет нюансы работы Рашид.

Данияр Омурзаков

Данияр Омурзаков

«Массовые обзвоны, где роботы эффективнее, всегда отдают нам. Например, мы за неделю обзвонили 350 тысяч клиентов. Для человека это физически невозможно: максимум 2,5 тысячи звонков в месяц», – добавляет Данияр Омурзаков.

«В финансовой сфере женские голоса воспринимаются лучше и повышают конверсию на 7–10%»

Сегодня решением от CyberNet AI пользуются крупные банки и микрофинансовые организации. Например, одним из первых клиентов стартапа в Казахстане стал Freedom Finance.

«Предложили им в течение месяца бесплатно протестировать наших голосовых роботов и запустили несколько направлений. Уже через пару дней стало ясно, что конверсии, которые дает ИИ, значительно выше. Для поддержки роста кредитного портфеля необходимо было бы увеличить штат контакт-центра с 11 до 160 человек. С этой задачей CyberNet AI справились за 4 дня, при этом не пришлось нанимать дополнительные персонал.

После этого к нам обратились другие крупные игроки, включая банки, в числе которых Home Credit Bank и Jusan Bank, а также кредитные организации, специализирующиеся не предоставлении кредитов через цифровые каналы. У многих из них доля коммуникаций с использованием ИИ уже превышает 80%», – говорит Виталий.

Также за несколько лет работы ребята заметили интересные нюансы, которые напрямую влияют на конверсию.

CyberNet AI

«В финансовой сфере женские голоса воспринимаются лучше и повышают конверсию на 7–10%. Тогда как в бытовой технике и электронике мужские голоса работают лучше. Есть и возрастные нюансы: в телемаркетинге и на ранних стадиях коллекшена эффективнее молодые женские голоса. А на поздних этапах коллекшена и в автобизнесе – взрослые мужские. Такие психологические детали сильно влияют на результаты, особенно при больших объемах коммуникаций», – рассказывает Иван.

«Когда роботы смогут самостоятельно подбирать тембр голоса, темп речи под каждого клиента, чтобы коммуникация была наиболее эффективной, тогда все, что связано с воронками, конверсиями, у роботов будет не просто на уровне людей, а даже лучше, чем у людей», – уверен Виталий.

«Модель была настолько хороша, что представители турецких банков сначала подумали: это настоящие операторы»

Начав с Казахстана, стартап масштабировался в соседние страны. Первым был Узбекистан – большая страна с растущей экономикой. Затем Кыргызстан, где благодаря схожести языка они быстро адаптировали технологии. После этого сделали первую попытку выйти на крупный рынок – Египет.

CyberNet AI

«В конце 2023 года мы прошли акселерацию Plug and Play и они нас позвали в Кремниевую долину. Мы посмотрели и решили для себя, что Америка очень конкурентная и развиваться там крайне тяжело. Сосредоточились на регионе MENA и запустились в Египте. Позже участвовали в программе AlchemistX, инициированной Astana Hub и Министерством цифрового развития. В последний момент подали заявку и попали в ТОП-10 лучших проектов. Эта программа стала толчком для нашего возвращения к американскому рынку», – вспоминает Иван.

Сейчас стартап развивается в США и Мексике. Пилоты компании уже запущены в нескольких штатах. Правда, на новом рынке стартап сталкивается с рядом сложностей.

«Вызовов хватает. Для США и Мексики мы разработали движок на базе LLM (Large Language Models). Там нет проблем с доступом к GPU, необходимым для систем ИИ. В Центральной Азии объем таких технологических ресурсов значительно меньше. Но что вселяет большую надежду – это поддержка руководства страны и фокус на развитие ИИ», – делится Иван.

Кстати, во время прохождения AlchemistХ ребята познакомились со специалистами из турецких банков и предложили им попробовать свое решение. Модель была настолько хороша, что представители банков сначала подумали: это просто турецкие операторы. Поняли, что это ИИ лишь потому, что все турецкие названия робот, созданный на основе англоязычной модели, проговаривал с американским акцентом.

CyberNet AI

«У нас очень мощный R&D с большим опытом. Для создания нового языка есть обученные модели. Акустическая база уже построена. Поверх акустической части у нас есть возможность дообучать на коротких датасетах, сделать fine-tune модели под определенный язык и тембр», – объясняет Рашид.

«Планируем, что к концу 2025 наш бизнес в Казахстане будет генерировать сотни тысяч долларов в месяц»

CyberNet AI вышли на прибыль достаточно быстро. С большинством клиентов стартап работает по формату ежемесячной подписки и уже имеет хорошие показатели выручки на представленных рынках.

«Планируем, что к концу 2025 наш бизнес в Казахстане будет генерировать выручку в сотни тысяч долларов в месяц. Узбекистан очень близко подберется к Казахстану, но все же вряд ли успеет его обогнать. Кыргызстан пройдет инвестиционную стадию, пробьет брейкивен и выйдет на выручку в десяти тысяч долларов в месяц. Египет максимально близко подойдет к выручке в $100 тысяч в месяц. Общее количество платящих клиентов должно достичь диапазона 125-150 компаний», – делится планами Виталий.

Сейчас все заработанные средства команда реинвестирует в R&D, новые технологии и рынки. Если говорить о масштабировании, то основной фокус CyberNet AI направлен на американский рынок. Ведь сейчас в США действует более 9 тысяч банков и кредитных союзов, а также свыше 11 тысяч небанковских финансовых организаций.

CyberNet AI

«Стратегически важный вызов – выбор стран для дальнейшей экспансии. Когда технология есть, возникает желание охватить весь мир. Но важно сохранить фокус, чтобы впустую не растрачивать ресурсы. Поэтому в течение 3 лет хотим выйти в США на MRR $4 млн. Это станет возможным за счет привлечения не менее 200 клиентов со средним месячным чеком $20 тысяч. При этом технологическое ядро бизнеса планируем оставить в Казахстане. Это позволит эффективно развивать и поддерживать продукты, сочетая передовые технологии с глубокой экспертизой», – резюмирует Иван.