Агентские системы, упрощение разработки и продуктовые новинки: эксперты Yandex Cloud делятся опытом

В начале ноября в Алматы состоялась флагманская конференция компании — Yandex Neuro Scale Kazakhstan. О представленных на ней обновлениях, а также о реальных кейсах и трендах ML-индустрии в совместной статье рассказали руководитель направления по развитию ML-сервисов Yandex Cloud Елена Белоброва и директор по развитию бизнеса ML & AI в Казахстане и Центральной Азии Александр Боришевич.

От ассистентов к агентам: новый этап развития ML-решений

Развитие агентских решений — часть стратегии Yandex Cloud. Разберемся, почему настал новый этап развития умных помощников, и чем агенты отличаются от ассистентов.

Ассистент отвечает на запросы пользователя в диалоге или через интерфейс взаимодействия — он не проявляет собственной инициативы. Агент — более сложная система, которая может работать без прямого запроса и решать задачи комплексно. Например, для бухгалтера агент может заполнять карточки в 1С и проверять контрагентов на риски, для маркетолога — анализировать коммуникации и обновлять данные в CRM. При необходимости агент запрашивает недостающую информацию у сотрудника.

Таким образом, ассистент — это реактивный помощник, а агент — проактивная система, которая способна самостоятельно достигать поставленной цели.

Современный этап развития агентских систем начался с появлением больших языковых моделей (LLM, large language model). Ранее ИИ-ассистенты и другие ML-системы требовали ручного прописывания правил и сценариев, что усложняло и ограничивало разработку. Большие языковые модели позволили передать часть логики оркестрации самой модели: теперь она может анализировать контекст, решать, какие действия выполнять, и определять, нужно ли обратиться за уточнением к пользователю или другому источнику данных, включая внешние.

LLM не «думает» в прямом смысле слова, но способна имитировать рассуждения и выстраивать логическую цепочку действий. Благодаря этому создавать интеллектуальных агентов стало быстрее и проще.

Преобразование результатов распознавания, выбор языка для генерации выводов и сопоставление со скриптом: новейшие обновления речевых технологий

Ранее Yandex Cloud представил обновления сервисов, связанных с распознаванием и синтезом речи: запустили новые голоса — Сауле и Жанар. Они поддерживают несколько амплуа и бесшовно переключаются между казахским и русским языками. Сейчас Yandex Cloud продолжает локализацию продуктов, использующих генеративные модели.

Сервис синтеза и распознавания речи Yandex SpeechKit теперь позволяет через единый API и распознавать речь, и преобразовывать результат распознавания с помощью генеративной модели. В промте можно детализировать, какой текст вы хотите получить на выходе, в том числе желаемую структуру. Система работает как с русским, так и с казахским языком, может перевести материал с языка оригинала на нужный заказчику или оставить в тексте два языка.

Yandex SpeechSense, сервис для анализа коммуникаций на основе генеративных моделей, стал доступен казахстанскому бизнесу в прошлом году. С начала 2025 года сервис поддерживает казахский язык. На Yandex Neuro Scale мы представили ассистента в рамках SpeechSense, который умеет:

  • анализировать разговоры на казахском и выдавать результаты на русском и наоборот;
  • анализировать соответствие диалогов менеджера скрипту и давать рекомендации по улучшению;
  • выдавать результат по любому промту мгновенно, без долгих настроек;
  • подробно анализировать диалоги сотрудников в точках продаж, в частности, можно определить, где речь клиента, а где — сотрудника, и разделить аудио на отдельные диалоги.

SpeechSense — один из самых быстрорастущих ML-продуктов в Казахстане, обновления используют уже больше десяти крупных корпоративных клиентов.

Как решили проблему задержки при общении с агентом

Долгий отклик был одним из основных препятствий для голосовых сценариев взаимодействия с LLM. На работу модели требовалось 1–3 секунды, плюс время на распознавание и синтез. Когда клиент задавал вопрос в колл-центре, перед ответом робот 3 секунды молчал. Пользователь думал, что его не услышали, повторял вопрос, и в этот момент робот начинал отвечать. Но так как клиент тоже начал говорить, робот замолкал — с большой задержкой этот сценарий неэффективен.

Мы разработали технологию Realtime API, которая сокращает среднее время отклика для коротких фраз менее чем до секунды, делая общение с пользователем гораздо более естественным. Инструмент доступен в рамках платформы для разработки AI-приложений Yandex AI Studio.

Это решение значительно улучшает клиентский опыт за счет низкой задержки и высокой точности ответа. Realtime API можно внедрить за несколько дней: если компания уже настроила текстового робота с подключением к CRM и базе знаний, его легко перевести в голосовой режим.

Yandex Cloud уже пилотирует несколько проектов в крупных финансовых организациях, где такой инструмент наиболее востребован.

Как превратить поиск по сайту в полноценного помощника

Яндекс — поисковая компания, у нас один из крупнейших индексов интернета, охватывающий миллиарды веб-страниц. Благодаря этому мы можем быстро и качественно находить релевантную информацию.

Инструмент Yandex Search API, также представленный в Казахстане, позволяет использовать этот индекс для собственных задач — например, поиска по сайту. Достаточно ограничить поиск своим доменом, и система будет выдавать релевантные страницы вашего сайта по пользовательским запросам.

Кроме того, можно добавить генеративный ответ — такой же, как например, в Алисе. Вместо списка ссылок пользователь получит краткий связный ответ на свой вопрос с указанием источников. Это делает поиск удобным и повышает конверсию.

Например, на сайтах страховых компаний у каждого продукта большое текстовое описание, в некоторых случаях есть подписи мелким шрифтом — разбираться сложно. Генеративный ответ позволяет быстро найти нужную информацию. Например, пользователь пишет в поисковой строке сайта: «Страховка на ребенка до 10 лет в Алматы до 50 тысяч тенге». Модель анализирует найденные страницы, извлекает нужные фрагменты, саммаризирует их и выводит готовый ответ со ссылками на подробную информацию.

Генеративный ответ можно интегрировать с голосом: подключить Realtime API и сделать голосового ассистента по сайту. Это особенно удобно для сложных сайтов, содержащих много информации, например, государственных и справочных ресурсов.

Еще одна функция Search API — поиск по картинке. Она востребована, например, на маркетплейсах, когда нужно найти товар, не зная его названия. Обычно это технически сложно реализуемая функция, но c Search API ее можно быстро и легко интегрировать в любой сайт. Опция предоставляется по модели SaaS — с оплатой только за запросы.

Search API можно применять не только к своему сайту, но и к сторонним. Сервис активно набирает аудиторию в Казахстане, поскольку он полностью адаптирован под казахстанских пользователей и казахский язык. Генеративный ответ работает на казахском, узбекском, русском языках.

Не только генеративные модели

Для работы агентских систем мало просто генеративных моделей — нужно еще много инструментов, которые позволяют задать агенту цель и логику того, как ее достигать.

Среди этих инструментов:

  • База знаний и поиск по ней.
  • Технологии парсинга документов и быстрый доступ к информации.
  • Внешние источники, такие как Search API и Web Search — для поиска того, чего нет во внутренней базе. Например, для ответа на вопрос, какая погода будет в Астане завтра.
  • MCP-коннекторы. MCP — протокол, по которому агент получает информацию из других систем. Например, когда звонит клиент, сейлс-менеджеру надо получить из CRM историю взаимодействия с ним.
  • Система оркестрации, где можно визуально собрать логику работы агента.
  • Инструменты мультимодальности, позволяющие агенту воспринимать текст, голос и изображения.

Все эти инструменты объединены на платформе Yandex AI Studio, которая включает:

  • Базовый слой моделей: генеративные (YandexGPT и опенсорсные модели), речевые (ASR, TTS), визуальные (VLM), OCR и др.
  • Слой работы с агентами: поиск, MCP, Workflow и прочие компоненты.
  • Прикладные решения на базе платформы, такие как SpeechSense.

Как оценивать эффективность внедрения технологий

Нужно смотреть на две ключевые группы метрик:

1. Затраты — в основном трудозатраты сотрудников. Допустим, задача, которая занимала час, стала занимать 40 или 20 минут. Это может быть незначительно в рамках одного специалиста и одной задачи, но это большие деньги в рамках крупной компании.

Например, бизнес внедряет ассистента для сотрудников поддержки. Когда приходит запрос от клиента, оператор сразу получает ответ, который сгенерировала модель. Так что ему не нужно писать ответ с нуля — достаточно скорректировать уже созданный. Если посчитать, насколько сократилось время обработки одной заявки, легко понять экономику внедрения.

2. Качество процессов и коммуникаций. В продажах, поддержке и любых коммуникациях с клиентами качество работы ИИ влияет на конверсию продаж и LTV клиента. Например, если перед встречей с клиентом модель проанализирует для менеджера всю историю коммуникации в CRM, внешнюю информацию о клиенте и приготовит варианты тем для обсуждения, это существенно повысит уровень пользовательского опыта.

В ряде кейсов автоматизация типовых запросов позволяет снизить расходы контакт-центров на 20–30% за счет сокращения нагрузки на операторов и уменьшения числа повторных обращений. Первые результаты бизнес обычно видит через 3–6 месяцев после внедрения.

Наиболее эффективные проекты получаются, когда компания понимает, какую бизнес-проблему хочет решить, и вовлечена в настройку системы. Специалисты Yandex Cloud помогают во всем разобраться на каждом этапе внедрения. Пилотирование обычно занимает от нескольких недель до месяца: этого достаточно, чтобы проверить точность распознавания, работу аналитики и удобство интеграций.

Как это работает на практике: реальные кейсы

Крупный строительный холдинг BI Group использует речевую аналитику Yandex Cloud. Ранее компания анализировала менее одного процента звонков, что не давало достаточного понимания качества обслуживания и не позволяло выявлять закономерности, причины отказов и риски. Внедрение Yandex SpeechSense позволило анализировать 100% коммуникаций. Более того, сотрудники получили инструмент для маркетинговых исследований для полного понимания пути клиента.

Изначально BI Group использовала сервис для входящих звонков, затем подключила телемаркетинг, чаты и другие отделы. В ближайших планах — настроить интеграцию SpeechSense с CRM для автоматического заполнения информации о контактах с клиентами. Далее компания планирует использовать инструмент для прогнозирования поведения клиентов и тиражировать его на другие подразделения, в том числе анализировать диалоги в точках продаж с помощью аудиобейджей. Также есть планы по использованию сервиса за пределами Казахстана.

ИТ-компания Kolesa Group, в числе продуктов которой — платформа для покупки и аренды недвижимости Krisha.kz, сначала пользовалась Yandex SpeechKit для автоматизации колл-центра. Затем компания внедрила сервис Translate, чтобы объявления автоматически переводились с русского на казахский и наоборот. Далее Kolesa Group добавила SpeechSense, причем внедрила сервис самостоятельно, без помощи разработчиков Yandex Cloud.

Внедрение происходит не в один момент, но это связано не со сложностями настройки, а с тем, что потребность в функциях растет во время использования системы. Клиент начинает получать инсайты, и ему хочется узнавать больше: настроить больше источников, подключить новые отчеты, собирать больше данных.

Тренды в индустрии ИИ в Казахстане

1. Снижение порога входа и трудозатрат. Речевую аналитику и ассистентов стало проще интегрировать: вместо сложных конфигураций теперь можно просто описать задачу ИИ-ассистенту и получить готовый результат.

2. Совместимость моделей и доступность опенсорсных решений. Чтобы пользователи могли быстрее начать использование AI Studio, мы поддерживаем OpenAI-совместимый формат. Это упрощает пользователям вход и дальнейшую разработку.

3. Переход от наращивания параметров моделей к платформенным экосистемам и точечным решениям под задачи. Yandex AI Studio — отражение этого тренда: платформа позволяет прототипировать и тестировать агентов даже без навыков программирования, что снижает порог входа.

4. Развитие и поддержка казахского языка. Недавно Yandex Cloud запустил новую технологию создания голосов: записывается несколько часов речи спикера на русском языке, и из этого синтезируется голос на казахском. Это удобно, когда нет времени записывать речь на двух языках, или когда спикер не владеет одним из языков.

5. Доступ к корпоративным ИИ-инструментам для сотрудников. В ближайший год эта международная практика будет набирать популярность в Казахстане, увеличивая продуктивность и сокращая время на выполнение рутинных задач.

Сегодня почти в каждой отрасли можно найти задачи, где искусственный интеллект повышает эффективность или снижает издержки. Речевая аналитика становится стандартом для среднего и крупного бизнеса. Но даже индивидуальные предприниматели могут использовать генеративные модели для своих задач: автоматизации документов, маркетинга, обработки клиентских обращений. Если у вас есть повторяющиеся рутинные задачи, которые отнимают много времени, генеративные модели в большинстве случаев смогут их решить.

Александр БоришевичЕлена БелоброваYandex Cloud