Казахстанцы придумали голосовых роботов, похожих на людей. Вот как работает технология
Искусственный интеллект, по мнению многих экспертов, произведет в нашей жизни более значительную революцию, чем любая другая технология. По прогнозам Sequoia Capital, следующие 10 лет пройдут под знаком AI-агентов. Стартап CyberNet AI, который занимается созданием голосовых роботов на основе ИИ, – часть этой трансформации. Казахстанским решением уже пользуются крупные компании в пяти странах.
Основатели проекта Иван Белохвостиков, Виталий Акулов и Рашид Исмаилов, а также руководитель по центральноазиатскому региону Данияр Омурзаков рассказали Digital Business о том, насколько эффективно голосовые роботы справляются с задачами финансовых и телеком-компаний, в каких ситуациях предпочтительнее женские голоса, а в каких – мужские. Также поговорили о перспективах развития стартапа на зарубежных рынках и экспансии в США.
«Основная задача – обучить роботов, чтобы их речь не отличалась от человеческой»
Иван, Виталий и Рашид знакомы давно. До запуска собственного стартапа они много лет работали в крупнейших банках Казахстана, Европы и США. Именно там, создавая цифровые проекты, ребята смогли оценить потенциал AI. Им быстро стало ясно, что за этой технологией будущее, так как она практически не имеет ограничений в возможностях. Так 3 года назад родилась идея CyberNet AI.
«Изначально делали все сами. Благо бэкграунд позволял. Я в свое время защитил диссертацию по computer science на тему «Системные исследования и оптимизация функционирования интернет-систем с использованием сетей Петри (предвестники нейросетей – прим. Digital Business)». Рашид – гениальный разработчик, который добирался до полуфинала чемпионата мира по программированию. Виталий начинал свою карьеру в американском Citibank. Там он занимался проектами, связанными с развитием клиентов из МСБ-сегмента.
Сегодня наш главный продукт – голосовые роботы AIDOS (Artificial Intelligence Dialog Operating System) для решения проблем, которые у компаний, особенно в финансовом секторе, похожи. Сегодня для качественного общения с клиентами нужны огромные контакт-центры и сотни людей. А в таких сложных направлениях, как возврат задолженностей или телемаркетинг, работа операторов требует еще и эмоциональной устойчивости. Мы увидели, что искусственный интеллект уже достиг уровня, при котором может решать задачи наравне с людьми, а часто даже лучше. В результате начали создавать цифровые контакт-центры, которые дешевле традиционных и значительно эффективнее.
Логика работы онлайн-робота во многом напоминает человека. Он «слушает» с помощью моделей ASR (Automatic Speech Recognition), которые преобразуют речь в текст. Затем информацию «обрабатывает мозг» – в этом помогают NLU или LLM, анализирующие текст, понимающие его смысл и формирующие ответ по заданной логике. Когда все готово, робот «говорит» через TTS (Text-to-Speech), преобразуя текст в голос. Основная задача – обучить модели так, чтобы их речь звучала естественно, а скорость общения не отличалась от человеческой даже при миллионах коммуникаций», – рассказывает Иван Белохвостиков.
«Никто не хочет общаться с машиной – все хотят разговаривать с человеком»
Главным конкурентным преимуществом в CyberNet AI считают собственную разработку, акцент на безопасности данных и возможность протестировать бесплатный пилот, который создается индивидуально под каждого заказчика.
«Большинство решений для распознавания и синтеза речи используют внешние сервисы, однако мы сделали ставку на закрытый контур, где данные остаются внутри страны. Такой подход оказался очень востребованным. Когда запускались, этого просто не было на рынке, и многие конкуренты до сих пор работают через внешние сервисы», – делится Рашид Исмаилов.
«Мы предлагаем партнерам бесплатный пилотный проект и даем возможность посмотреть на реальный результат. Они тестируют наши решения, сравнивают эффективность своего контакт-центра и AI, смотрят на цифры. Когда наши роботы выигрывают, вопроса о внедрении больше не возникает. После таких пилотов конверсия в подписанные договора более 95%», – добавляет Виталий Акулов.
К числу преимуществ также можно отнести использование SaaS-моделей, которые экономят клиентам время и деньги, а также делают их гибкими. Фактически мы даем возможность нанимать цифровых сотрудников и ежемесячно платить за них. Пример: партнер на весь 2024-й год расширил свой контакт-центр на 120 наших AI-агентов. Один AI-агент обходится дешевле на 254 тысячи тенге в месяц, чем новый сотрудник. Получается, за год удается сэкономить 365,7 млн тенге.
Также важно отметить, что пользователям CyberNet AI не нужно покупать оборудование для контакт-центров, нанимать и обучать сотрудников, арендовать помещения. Они платят только за фактическое использование, а мощность можно увеличивать или снижать в зависимости от нагрузки. Размещение облака в ЦОДах, которые используют крупнейшие финансовые институты, гарантирует надежность и максимальную безопасность.
«Мы работаем на огромных объемах, обеспечивая ежедневное взаимодействие с сотнями тысяч людей. В пиковые дни наш сервис обрабатывает по 300 тысяч коммуникаций. Одна из ключевых задач – минимизировать latency (задержку ответа), чтобы собеседник не понял, что говорит с роботом. Никто не хочет общаться с машиной – все хотят разговаривать с человеком.
Цель – сделать речь робота максимально естественной. Особенность наших технологий – мультиязыковые модели. Один и тот же голос может говорить, например, на казахском и русском, переключаясь между ними в рамках одного диалога. Также партнер может предоставить пример понравившегося голоса, а мы синтезируем их для робота, адаптируя под индивидуальный запрос», – объясняет нюансы работы Рашид.
«Массовые обзвоны, где роботы эффективнее, всегда отдают нам. Например, мы за неделю обзвонили 350 тысяч клиентов. Для человека это физически невозможно: максимум 2,5 тысячи звонков в месяц», – добавляет Данияр Омурзаков.
«В финансовой сфере женские голоса воспринимаются лучше и повышают конверсию на 7–10%»
Сегодня решением от CyberNet AI пользуются крупные банки и микрофинансовые организации. Например, одним из первых клиентов стартапа в Казахстане стал Freedom Finance.
«Предложили им в течение месяца бесплатно протестировать наших голосовых роботов и запустили несколько направлений. Уже через пару дней стало ясно, что конверсии, которые дает ИИ, значительно выше. Для поддержки роста кредитного портфеля необходимо было бы увеличить штат контакт-центра с 11 до 160 человек. С этой задачей CyberNet AI справились за 4 дня, при этом не пришлось нанимать дополнительные персонал.
После этого к нам обратились другие крупные игроки, включая банки, в числе которых Home Credit Bank и Jusan Bank, а также кредитные организации, специализирующиеся не предоставлении кредитов через цифровые каналы. У многих из них доля коммуникаций с использованием ИИ уже превышает 80%», – говорит Виталий.
Также за несколько лет работы ребята заметили интересные нюансы, которые напрямую влияют на конверсию.
«В финансовой сфере женские голоса воспринимаются лучше и повышают конверсию на 7–10%. Тогда как в бытовой технике и электронике мужские голоса работают лучше. Есть и возрастные нюансы: в телемаркетинге и на ранних стадиях коллекшена эффективнее молодые женские голоса. А на поздних этапах коллекшена и в автобизнесе – взрослые мужские. Такие психологические детали сильно влияют на результаты, особенно при больших объемах коммуникаций», – рассказывает Иван.
«Когда роботы смогут самостоятельно подбирать тембр голоса, темп речи под каждого клиента, чтобы коммуникация была наиболее эффективной, тогда все, что связано с воронками, конверсиями, у роботов будет не просто на уровне людей, а даже лучше, чем у людей», – уверен Виталий.
«Модель была настолько хороша, что представители турецких банков сначала подумали: это настоящие операторы»
Начав с Казахстана, стартап масштабировался в соседние страны. Первым был Узбекистан – большая страна с растущей экономикой. Затем Кыргызстан, где благодаря схожести языка они быстро адаптировали технологии. После этого сделали первую попытку выйти на крупный рынок – Египет.
«В конце 2023 года мы прошли акселерацию Plug and Play и они нас позвали в Кремниевую долину. Мы посмотрели и решили для себя, что Америка очень конкурентная и развиваться там крайне тяжело. Сосредоточились на регионе MENA и запустились в Египте. Позже участвовали в программе AlchemistX, инициированной Astana Hub и Министерством цифрового развития. В последний момент подали заявку и попали в ТОП-10 лучших проектов. Эта программа стала толчком для нашего возвращения к американскому рынку», – вспоминает Иван.
Сейчас стартап развивается в США и Мексике. Пилоты компании уже запущены в нескольких штатах. Правда, на новом рынке стартап сталкивается с рядом сложностей.
«Вызовов хватает. Для США и Мексики мы разработали движок на базе LLM (Large Language Models). Там нет проблем с доступом к GPU, необходимым для систем ИИ. В Центральной Азии объем таких технологических ресурсов значительно меньше. Но что вселяет большую надежду – это поддержка руководства страны и фокус на развитие ИИ», – делится Иван.
Кстати, во время прохождения AlchemistХ ребята познакомились со специалистами из турецких банков и предложили им попробовать свое решение. Модель была настолько хороша, что представители банков сначала подумали: это просто турецкие операторы. Поняли, что это ИИ лишь потому, что все турецкие названия робот, созданный на основе англоязычной модели, проговаривал с американским акцентом.
«У нас очень мощный R&D с большим опытом. Для создания нового языка есть обученные модели. Акустическая база уже построена. Поверх акустической части у нас есть возможность дообучать на коротких датасетах, сделать fine-tune модели под определенный язык и тембр», – объясняет Рашид.
«Планируем, что к концу 2025 наш бизнес в Казахстане будет генерировать сотни тысяч долларов в месяц»
CyberNet AI вышли на прибыль достаточно быстро. С большинством клиентов стартап работает по формату ежемесячной подписки и уже имеет хорошие показатели выручки на представленных рынках.
«Планируем, что к концу 2025 наш бизнес в Казахстане будет генерировать выручку в сотни тысяч долларов в месяц. Узбекистан очень близко подберется к Казахстану, но все же вряд ли успеет его обогнать. Кыргызстан пройдет инвестиционную стадию, пробьет брейкивен и выйдет на выручку в десяти тысяч долларов в месяц. Египет максимально близко подойдет к выручке в $100 тысяч в месяц. Общее количество платящих клиентов должно достичь диапазона 125-150 компаний», – делится планами Виталий.
Сейчас все заработанные средства команда реинвестирует в R&D, новые технологии и рынки. Если говорить о масштабировании, то основной фокус CyberNet AI направлен на американский рынок. Ведь сейчас в США действует более 9 тысяч банков и кредитных союзов, а также свыше 11 тысяч небанковских финансовых организаций.
«Стратегически важный вызов – выбор стран для дальнейшей экспансии. Когда технология есть, возникает желание охватить весь мир. Но важно сохранить фокус, чтобы впустую не растрачивать ресурсы. Поэтому в течение 3 лет хотим выйти в США на MRR $4 млн. Это станет возможным за счет привлечения не менее 200 клиентов со средним месячным чеком $20 тысяч. При этом технологическое ядро бизнеса планируем оставить в Казахстане. Это позволит эффективно развивать и поддерживать продукты, сочетая передовые технологии с глубокой экспертизой», – резюмирует Иван.