GoatChat.ai не совсем обычный стартап. Он не решает очевидных болей, но с первых месяцев стал прибыльным, попав в топы App Store по скачиваниям в разных странах. Приложение GoatChat работает на базе больших языковых моделей (LLM), аналогичных Chat GPT. Это позволяет создавать цифрового двойника, картинки, рассказы и др.
Прежде чем открыть компанию в США, фаундеры стартапа добились успеха в ИТ-аутсорсе. Их первым проектом на глобальном рынке стал конструктор маркетплейсов ADAPT, после чего они переформатировались в research-компанию в области AI. Ее кофаундер Ербол Копжасар рассказал для совместного проекта Digital Business и Astana Hub «100 стартап-историй Казахстана», на что способен GoatChat, как стартап из 12 человек может конкурировать с техногигантами из Кремниевой долины и куда движется AI-индустрия.
«В общей сложности протестировали 50-60 разных моделей, из которых используем около 10»
– Ербол, как вы попали в стартап-индустрию?
– В 16 лет уехал на учебу в Великобританию (Newcastle University). Бесплатно проучился там до третьего курса по стипендии за высокую успеваемость. К окончанию универа я уже был разработчиком в одном мессенджере, но решил вернуться в Казахстан.
Сначала поработал ментором в nFactorial. Потом захотел разобраться, как функционирует госсектор и устроился в МФЦА. Параллельно поступали заказы на разработку, но кодить самому уже не хотелось. В итоге начал делегировать задачи и стал проджект-менеджером. Проекты были самые разные – от магазина обуви до Python-бота для отслеживания упоминаний заказчика в интернете.
Потом познакомился со своим бизнес-партнером Бакытжаном Досом. Мы на год уехали в Москву делать приложение по аренде люксовых машин для компании «Делимобиль», купившей Anytime. Когда пишешь софт, обычно редко соприкасаешься с жизненными ситуациями, а там приходилось решать задачи от оплаты парковки до остановки двигателя спорткара, летящего по трассе. Вернувшись в Казахстан, решили заняться своими проектами.
– Еще в начале года вы с кофаундером работали над стартапом ADAPT, в который привлекли $500 тыс инвестиций. Что с ним сейчас?
– Его развитие потребовало больше внимания и вертикального фокуса на отдельных рынках с глубокими системными интеграциями, что не совсем соответствовало приоритетам масштабирования. Также в этом бизнесе достаточно высокая стоимость привлечения клиентов. Даже с учетом того, что мы работали не только в США, но и в Бразилии, где этот показатель ниже. Для пользователей, которые купили подписку, сервис по-прежнему доступен, но скачивание приложения мы ограничили.
В то же время, смотря, как резко растет спрос на AI, сомнений, куда дальше двигаться, ни у кого не возникло. Произошел технологический прорыв. Люди сразу начали платить за новый пользовательский опыт, даже несмотря на технические ограничения.
– Теперь о самом стартапе. Расскажите, с чего все началось?
– Идея чата возникла во время очередного брейншторма с Бахытжаном. У нас сумасшедшая команда и идеи, которые мы воплощаем. Причем и с технологической, и с продуктовой точки зрения. Goat – это аббревиатура от greatest of all time (величайший из всех времен).
Подумали, раз человек может общаться с нейросетью, так почему бы ему не поговорить с Эйнштейном? Речевую модель можно обучить общаться от лица любой известной личности. Насколько сильным было наше удивление, когда люди оказались готовы за это платить. Потом решили пойти дальше и расширили функционал.
– Какие функции доступны в вашем приложении?
– Сейчас Goat Chat предлагает три основных раздела. Первый – это онлайн-ассистент с возможностью загрузки файлов. Также подключили к нему web-браузер. Открывая любую страницу в интернете, наш ассистент может ее резюмировать и общаться с вами на базе изученного контекста. В таком случае языковая модель опирается на предоставленную информацию, а не массив изученных данных из последней версии Chat GPT. По тому же принципу можно загрузить PDF-файл. Единственное, с русским языком наша модель работает пока не так хорошо, так как обучали ее в основном на английском.
Второй – explore. В этом разделе пользователю доступны разные AI чат-боты, представленные на рынке. С их помощью он может генерировать визуальный и текстовый контент, будь то картинки, иллюстрации, рассказы и т.д.
Генерации видео пока нет. Это очень дорого, и нам не хватит «железа», хотя у нас, наверное, самое большое количество промышленных видеокарт в Казахстане. Их вычислительную мощность можно использовать для обучения моделей либо генерирования контента. Сейчас все называют AI, но та же генерация картинок и видео – разные технологии.
Третий – создание цифрового двойника или любого персонажа. Достаточно загрузить в свой чат-бот необходимую информацию, и он сможет отвечать на разные вопросы. Например, по финансовой грамотности. Также с ним могут общаться другие люди. При необходимости авторский чат-бот всегда можно доработать. Интересно, что общаясь с ботами-двойниками люди гораздо чаще здороваются с ними и говорят спасибо, чем просто онлайн-ассистенту.
В бесплатной версии можно отправить 9 сообщений и сгенерировать до 5 картинок. В платной ограничений нет и доступно больше функционала. Плюс можно общаться с более натренированной моделью на базе Chat GPT 4. В общей сложности протестировали 50-60 разных моделей, из которых используем около 10. Несколько из них – наши собственные. При этом 95% юзеров использует только две – чат-бот и ассистента.
Читайте также: Теперь школьники могут учить математику и зарабатывать! И это не шутка
«Сейчас у нас почти 5 млн. скачиваний в App Store»
– Насколько выгодной оказалась модель с подписками?
– Мы прибыльная компания. В App Store приложение доступно с января. В марте Techcrunch добавил нас в рейтинг 10 самых прибыльных AI-стартапов. Сейчас у нас почти 5 млн скачиваний в App Store, а стоимость подписки зависит от страны. Например, в США недельная подписка составляет $9,99, месячная – $24,99, а годовая – $99,99. При этом мы часто проводим AB-тесты и меняем цены, желая понять, что дольше всего задерживает пользователей в приложении.
Вообще, ценообразование – достаточно важная история в App Store. Какую подписку сначала показать человеку: недельную или сразу месячную? Таких вопросов очень много, и все нужно тестировать. Благо, у нас есть аудитория, на которой можем проверять гипотезы.
– Какую подписку чаще всего покупают и как много пользователей остается в приложении?
– Думаю, недельную. При этом активная аудитория – около 1 млн человек в месяц. Регулярные продажи у нас начались с конца февраля. Неожиданно мы стали первым приложением из Казахстана, попавшем в топ-10 App Store Франции, Германии, Южной Кореи, Польши и других стран. Для этого требуется большое количество ежедневных скачиваний, а не разовый скачок загрузок.
Другой важный показатель – частота использования. Проблема многих приложений в том, что их скачивают по переходу из соцсетей, но забывают сразу открывать.
– Во сколько сейчас оценивается ваша компания?
– Боюсь ошибиться с цифрой, но точно могу сказать, что за последние пару лет мы подняли $1,2 млн. инвестиций. Это включая деньги от 500 Startups, MOST VC и Мурата Абдрахманова. Сейчас готовимся к новому раунду и хотим привлечь от $30 млн.
«Долина так устроена, что конкурировать там могут только фундаментальные компании»
– В чем, на ваш взгляд, наибольшая польза приложения для пользователей?
– Для кого-то это возможность быстро получить нужную информацию. Например, как помыть кошку или услышать, что у вас все получится. В сентябре наблюдали повышенную активность среди студентов. Еще чат активно используют для мейлов. А когда запускали рекламу в TikTok, самый конверсионный ролик на мужскую аудиторию демонстрировал, как GoatChat помогает парню вернуть свою девушку одним сообщением.
Представьте сервис, в котором можно делать все, что угодно. Непрерывное развитие моделей будет создавать новые юзкейсы. Но еще больший вклад сможем внести, развивая research-направление.
– Почему вам стали важны исследования? Ведь приложение и так приносит прибыль.
– На самом деле, аналогов у GoatСhat предостаточно, и у многих из них изначально были собственные языковые модели. Кремниевая долина так устроена, что конкурировать там могут только фундаментальные компании. По той же причине мы много денег вкладываем в «железо» и специалистов. В Казахстане нам удалось найти только троих AI-исследователей.
Сейчас в компании, помимо разработчиков и продуктовой команды, работает пять ресечеров. Сфера AI-исследований развивается бешеными темпами. Ежедневно публикуется по 7-8 научных статей, каждая из которых в теории может изменить какую-то индустрию. Мы уже подготовили одну научную публикацию и работаем еще над несколькими.
– На какую тему ведете исследования?
– Наша первая статья затрагивает область цензурирования ответов на запрещенные темы вроде насилия. На примере GOAT 7 доказали, что ограничения приводят к ухудшению качества любых ответом в целом. С той же проблемой сталкиваются все языковые модели, за исключением GPT 4. Никто точно не знает, как она на самом деле устроена и каким образом ее обучали.
У языковых моделей есть еще две нерешенные проблемы. Первая – «галлюцинации» или выдача ложной информации. Вторая – длина контекста. Общаясь с чатом, у вас есть лимит слов в сообщении или одной сессии. Пока лимит языковых моделей — 32 тысячи токенов или 16 тысяч слов. Разработчикам еще предстоит создать модель, способную написать «Войну и мир 2» хорошего качества.
Мы и сейчас книги пишем. Наша новая модель за 5 минут генерирует истории на 128 страниц. В перспективе хотим создавать с ее помощью киносценарии. Тестовую версию уже скачали 10 тыс. человек. Достаточно указать, о чем будет сюжет, кто главный персонаж, и модель сама все напишет.
Читайте также: Бывший госслужащий сделал стартап, который позволяет подписывать договоры онлайн с помощью SMS
«В тех сферах, где собрать данные в простом и структурированном виде не получится, изменения будут происходить долго»
– Неужели нейросети со временем оставят киносценаристов и других специалистов без работы?
– В этом большая опасность всей AI-индустрии. Open AI выделила около $10 млн на безопасность своих разработок. Но эта сумма ничто по сравнению с тем, сколько компания тратит на железо.
В тех сферах, где собрать данные в простом и структурированном виде не получится, изменения будут происходить долго. AI-оптимисты считают, что нейросети станут вспомогательным инструментом, нежели полноценной заменой. Однако я с ними не соглашусь. Как только McDonald’s установил себе автоматические кассы, компания сократила штат кассиров. Капитал всегда будет гнаться за повышением эффективности труда. Соответственно, нужно искать такие сферы, где ваши компетенции не заменит никакая языковая или любая другая модель.
Например, в Калифорнии компания Cruise уже предлагает услуги такси без водителей. Там сейчас вообще не до шуток. Люди выходят бастовать. И это происходит в стране с самой развитой экономикой в мире. Все это не вызывает оптимизма, но мне кажется, появится много новых профессий. Условно, сценаристы станут больше редактировать сценарии и придумывать для них идеи, чем писать все с нуля.
– Поделитесь ближайшими планами по развитию компании?
– Хочется, чтобы наши исследования и модели могли использовать другие люди. Та же OpenAI – это в первую очередь research-компания, которая смогла монетизировать свои исследования. Мы продолжим выпускать новые B2C-продукты или обновлять текущие за счет новых технологий.
Еще планируем полную релокацию команды в Сан-Франциско в ближайшее время. Бакытжан уже находится там, некоторые члены команды тоже переехали. В США мы зарегистрировались еще три года назад, так как изначально хотели развиваться на рынке, где возможен тысячный рост. К слову, нам уже предлагали выкупить домен Goat.ai за сотню тысяч долларов. Вот уж не думали, что эта самая выгодная инвестиция в нашей жизни.
«В AI уйдет весь базовый консалтинг, в частности какие-то поверхностные вопросы»
– На рынке доступно много разных LLM. Как понять, какая языковая модель лучше?
– С этим вопросом как-то обратился к нашему ML-инженеру. Оpen-source комьюнити проверяет модели с помощью тестов, включающих тысячи разных вопросов. Их результаты показывают, насколько хорошо модель выстраивает логическую цепочку из информации. У Chat GPT эта оценка в районе 70 баллов, у Lama 2 – 68. Вторая, кстати, опенсорсная, и ее можно дообучать, чем и занимаются AI-энтузиасты, соревнуясь между собой. Мы тоже играли в эту игру. Наша Goat-7B получила хорошие оценки, и ее скачали ±10 тысяч раз.
– Поделитесь своими прогнозами по развитию АI-индустрии?
– В первую очередь, это покадровая видеогенерация. Как только модели смогут создавать видео без искажений, информации просто перестанут доверять. Представьте, что через три года мошенники пришлют видеосообщение от вашей мамы, сгенерированное нейросетью. Базовые технологии дипфейков появились еще лет 5 назад, но они продолжают совершенствоваться, достигнув 95% сходства изображений. Из плюсов – по той же логике можно будет создавать анимацию.
Также в AI уйдет весь базовый консалтинг, в частности какие-то поверхностные вопросы. Если решится проблема ограничения контекста, те же программисты будут меньше кодить. Уже сейчас мы не нанимаем джунов, потому что есть плагины, дописывающие код за разработчиков. Но в любом случае его нужно проверять, дебажить и т.д.
Все точно изменится с появлением так называемого Self-play. Сейчас нейросети обучаем мы, но для этой задачи могут появиться отдельные модели. Простым словами программу будет обучать и проверять другая программа. Каждую неделю появляются новые статьи на эту тему, но пока все терпят неудачу.
– А что насчет регулирования AI-индустрии? Разработчиков уже призывали притормозить с развитием искусственного интеллекта.
– Регулирование AI в США будет работать так, как этого захочет капитал. Допустим, решит Warner Bros. защитить своих копирайтеров, заплатит $10 млн какому-нибудь сенатору, и он пойдет защищать нужный закон. Закон – это шантаж, и если у власти окажутся демократы, которых поддерживают AI-компании, будет соответствующие законодательство.
– Недавно в Казахстане тоже заговорили о важности развития технологий искусственного интеллекта. Как считаете, насколько это реалистично?
– Для этого нужно ехать в Тайвань и просить поставить хотя бы в университеты видеокарты NVIDIA DGX H100 100. Одна такая стоит $300 тыс. Чтобы заниматься исследованиями, их нужно 64. Но даже если решите закупить железо, провайдер попросит встать в очередь, либо заплатить очень много денег. Сейчас владение таким ресурсом – политический и элитарный вопрос.