Альпина GPT: 9 000 пользователей, −1 977 часов и главный барьер корпоративного ИИ

Архитектура агрегатора из 42 моделей, разбор воронки первого касания и измеренная экономия часов на маркетинге книгоиздания.

Павел Путинцев, продакт-менеджер Альпина GPT (Alpina Digital), ex-куратор курса “ИИ в действии: как эффективно решать бизнес-задачи с помощью нейросетей. Физфак МГУ + KAUST (магистратура по компьютерным наукам). Канал в Telegram: «Дело в промпте» .

Маркетинг в книгоиздании с ИИ — экономия в человекочасах

В апреле 2026 года 92% новых пользователей Альпина GPT уходили с платформы, не сделав ни одного запроса к модели. У возвратных пользователей эта доля — 58%. И это не про «глупых юзеров» — это про сломанный продуктовый механизм: корпоративный агрегатор ИИ без встроенного обучения превращается в дорогую витрину.

Мы построили Альпина GPT — внутренний стартап Alpina Digital, который сегодня собрал 42 модели в одном окне и 9 000 зарегистрированных пользователей. Параллельно — сами на себе замерили эффект: маркетинг книгоиздания через эту платформу освободил 1 425–1 977 человекочасов в год.

Дальше — без рекламы: как устроена архитектура, что сломалось в первой версии, какие три типа ИИ-агентов реально работают в проекте и почему «просто дать доступ к ChatGPT» — это самая дорогая ошибка корпоративного внедрения.

Зачем нам понадобился свой агрегатор

Издательская группа Альпина — крупнейшая универсальная независимая издательская группа в России. И у нас не только книги, но и онлайн-курсы с корпоративными образовательными продуктами. Когда в 2024 году команда массово полезла в нейросети, мы упёрлись в три стены, знакомые любому российскому CTO.

Стена 1 — биллинг и платежи. Корпоративный ChatGPT нельзя оплатить с российского юрлица. VPN — это не решение для 200+ сотрудников.

Стена 2 — данные. Книгоиздательство работает с авторскими правами, неопубликованными рукописями, контрактами. Лить это в облако к OpenAI напрямую — не вариант. 152-ФЗ обязывает хранить персональные данные на серверах в РФ.

Стена 3 — модельный зоопарк. Для разных задач — разные модели. Claude хорош в длинном анализе, GPT — в коде, Perplexity — в фактах со ссылками. Заводить 5 подписок, 5 интерфейсов, 5 логинов — это операционный ад.

Так появилась идея Альпина GPT — один интерфейс, единый биллинг, российский контур, доступ ко всем актуальным моделям через API. Сначала — для своих, потом — для рынка.

Под капотом: 42 модели, ручной выбор и почему мы не делали автороутинг

Сейчас в Альпина GPT 42 модели в активном пуле — от лёгких и быстрых для черновой переписки до тяжёлых reasoning-моделей под аналитику и код. Под каждый класс задач — свой инструмент.

Где живут данные. Selectel + Yandex Cloud, два независимых провайдера для диверсификации рисков. Соответствие 152-ФЗ. Внешние модели подключены через API — данные пользователя не остаются на стороне OpenAI / Anthropic / Google и не используются для дообучения моделей. Доступа к содержимому переписок не имеем даже мы.

Биллинг — Альпина-токены. Внутренняя валюта с относительной шкалой стоимости от 1 до 5 баллов на запрос. Условно: nano-модель — 1 балл, Opus — 5 баллов. Это спрятанная сложность: у каждого API-провайдера своя токенизация, свои цены за вход и выход, своя длина контекстного окна. Сводить это в одну понятную метрику для пользователя — отдельная инженерная задача.

Главное архитектурное решение: автороутинг мы не делали. Модель выбирает сам пользователь.

Это контринтуитивно. Все «умные» агрегаторы в мире сейчас идут в сторону «вы только пишите запрос, мы сами подберём LLM». Мы сознательно пошли в другую сторону — по двум причинам.

Первая — техническая. Качественный роутинг требует ещё одной модели-классификатора, которая на входе решает, какая LLM подойдёт. Это плюс задержка, плюс свои ошибки классификации, плюс непрозрачность для пользователя — «почему мне ответил Gemini, я хотел Claude».

Вторая — продуктовая. Если пользователь не понимает, какая модель ему отвечает, он не учится. А (см. следующую секцию) обучение — это в нашей бизнес-модели ключевая часть продукта, а не «приятное дополнение».

Failover при этом работает — на демо это видно постоянно: GPT-5 завис на 30 секунд, пользователь переключается на Claude Sonnet 4.5, получает ответ за две секунды. Архитектура одного окна делает это переключение бесшовным.

On-premise. Для клиентов с жёсткими требованиями по контуру у нас отдельное решение — платформа разворачивается внутри корпоративной сети заказчика, без обращений к внешним API. Это уже не «commodity AI», а инфраструктурный продукт.

Первая итерация: упёрлись в проблему «пустого окна»

Первые продажи стартовали ещё в конце 2024 года. Тогда продукт выглядел иначе — сырой, тяжёлый, c интерфейсом, к которому стыдно было приводить нового клиента. Мы накапливали обратную связь, перерабатывали платформу и в августе 2025-го выкатили полный ребрендинг плюс открыли публичный доступ для физлиц. С этого момента трафик в Метрике начал расти ощутимо — и за ним же вылезла та самая проблема, которую внутри корпоративного контура мы недооценивали.

Новый пользователь приходил, регистрировался, заходил в чат — и закрывал вкладку через минуту. Уровень бесплатного триала (100 токенов & 3 дня — без промокода) выгорал у активного юзера за день. Но у «активных» — это была меньшая часть.

Большинство залогинивалось, видело пустое поле ввода и не понимало, что в него писать. Это классическая проблема ChatGPT-подобных интерфейсов, перенесённая в корпоративный контекст. У ChatGPT её хотя бы маскирует огромное количество онлайн-туториалов и личная мотивация пользователя «попробовать модную штуку». В корпоративном продукте, который сотруднику прислал HR или ИТ-департамент, — этой мотивации нет.

Что говорят цифры

Голословно про «пустое окно» можно говорить долго. Поэтому я залез в нашу аналитику и достал точные числа — чтобы и сам диагноз поставить корректно, и читатель мог проверить логику.

Источник данных.

Яндекс.Метрика. Период — апрель 2026 года, последний полный календарный месяц. Ключевая цель — model_used, срабатывает при каждом запросе пользователя к любой из 42 моделей. Сегментация — стандартная разбивка Метрики на новых и возвратных пользователей.

Сегмент	Визитов	Визитов с запросом	Конверсия	Запросов за активный визит
Новые пользователи	5 120	393	7,7 %	4,46
Возвратные пользователи	12 560	5 298	42,2 %	4,48
Всего	17 680	5 691	32,2 %	4,48

Что из этого следует

Главный разрыв — в конверсии в первый запрос: 7,7% у новичков против 42,2% у возвратных. Это разрыв в 5,5 раз в шансе вообще дойти до первого использования.

Но дальше — самое интересное. Те новички, которые всё-таки прорываются к первому запросу, дальше ведут себя точно так же, как ветераны: ~4,5 запроса за визит. Разница между сегментами в интенсивности работы — нулевая (4,46 vs 4,48).

Это качественно меняет диагноз. Проблема — не в том, что «новички плохо умеют пользоваться ИИ» и им надо подтянуть навык. Проблема исключительно в барьере первого касания: 92% новых пользователей не доходят до запроса №1. Если барьер пройден — пользователь сразу работает в полный ход.

Перевожу на язык бизнеса: из 100 новых пользователей 92 не пробуют ни одного запроса в первый визит. Если ничего не делать — большинство из них не вернётся никогда. Это и есть «дорогая витрина»: лицензии куплены, серверы оплачены, а реальная экономика продукта строится на тех 8%, кто как-то самостоятельно прорвался через пустое окно.

Был ещё подкласс той же проблемы — UX-баг с полем «Промокод». Новички его пропускали и попадали в триал на 100 токенов вместо 1 000. Поле переделали — стало нагляднее. Но это копеечный фикс. Главная проблема была не в нём, а в том самом «первом касании».

Что встроили: библиотека промптов, курс и AI Academy

Решение оказалось не техническим, а продуктовым. Раз диагноз — «барьер первого касания», то и лечить надо именно его: дать новичку готовый сценарий, в который не нужно «придумать идеальный промпт». Мы достроили рядом с ядром платформы три обучающих модуля.

Библиотека промптов. Каталог готовых шаблонов под типовые корпоративные задачи: написать пост для соцсетей, сделать саммари встречи, проанализировать отчёт, подготовить ТЗ для подрядчика. Пользователь не пишет с нуля — он выбирает близкий шаблон, заполняет 2–3 переменные и отправляет. Точка входа для новичка снижается с «придумай идеальный промпт» до «выбери из меню». На дорожной карте — расшаривание шаблонов внутри команды (сейчас приватные).

Встроенный курс “ИИ в действии”: как эффективно решать бизнес-задачи с помощью нейросетей. Последний поток стартовал 6 апреля 2025 года и завершил серию из четырёх потоков, проведённых за год. Это не вебинар про «что такое нейросети», а практический интенсив: пользователь параллельно работает в Альпина GPT и проходит структурированные задания. Метрики курса считаем по тем же воронкам — выпускник курса в среднем делает в 3–5 раз больше запросов в месяц, чем неучаствовавший пользователь.

AI Academy. Постоянная программа: цикл вебинаров, разборы кейсов, разборы новых функций платформы. Бесплатно для зарегистрированных пользователей. Это удерживающий контур — выпускник курса попадает не в пустоту, а в регулярный поток обновлений.

Через несколько недель после того, как обучающие модули и шаблоны стали частью пользовательского пути, конверсия в первый запрос у новичков поползла вверх. Точные цифры покажу в следующем материале — там это требует отдельного разбора. Здесь важна сама конструкция: библиотека готовых сценариев + учебный поток + регулярные вебинары — это не «маркетинг вокруг продукта», а часть продукта, без которой агрегатор моделей не доезжает до пользователя.

Кейс №1: маркетинг книгоиздания на собственной платформе — минус 1 977 часов в год

Главный внутренний кейс — мы измерили эффект на самих себе, на маркетинг-команде издательской группы Альпина, которая занимается продвижением книг.

Что было до. Команда вручную писала четыре типа контента: посты в соцсети, статьи на сайт и партнёрские площадки, презентации для авторов и партнёров, рекламные аннотации для каждой выпускаемой книги. Издательство выпускает десятки книг в год, и на каждую — свой контент-пакет. Это съедало большую часть редакторских часов.

Что сделали. Под каждый тип контента собрали ИИ-ассистента в Альпина GPT с инструкцией, базой знаний (стиль издательства, целевые аудитории, успешные референсы) и параметрами генерации. Маркетолог не пишет с нуля — он даёт ассистенту вводные (название книги, аудитория, ключевые тезисы), получает черновик, дорабатывает и публикует.

Результаты за год (расчёт от внутреннего замера):

Тип контента	Без ИИ, ч/год	С ИИ, ч/год	Экономия	Кратность
Посты	~370	~100	~270 ч	×3,7
Статьи	~130	~50	~80 ч	×2,6
Презентации	~250	~100	~150 ч	×2,5
Рекламные аннотации	~1 000	~50	~950 ч	×20
Итого	~1 750	~300	1 425–1 977 ч	×5,8

Самый драматичный кейс — рекламные аннотации (короткие тексты под каждое издание для маркетплейсов, рекламы, партнёрских материалов). Раньше — час на одну, теперь — 3 минуты на черновик и 5 минут на редактуру. На каталоге в сотни книг это экономия в 20 раз.

Важная оговорка для скептиков: эти часы не «исчезли в воздухе». Они высвободились под более сложную работу — стратегическое планирование контент-плана, переговоры с инфлюенсерами, нестандартные кампании. Контент-команда не сократилась, она сменила фокус.

Кейс №2: три рабочих ИИ-ассистента, которые встроились в ежедневные процессы

Помимо контента, мы встроили в работу команды трёх ассистентов другого класса. Не «помоги написать», а «выполни структурированную задачу».

Ассистент 1 — Помощник руководителя проектов

Задача. Проект-менеджер получает запись 60-минутного созвона с клиентом или внутренней команды. Раньше — час сидит, расшифровывает, выписывает решения, рассылает протокол. Сейчас — загружает аудио в ассистента и получает структурированный документ.

Системный промпт (упрощённо). «Ты — помощник руководителя проектов Apollo. На входе — транскрипт встречи. На выходе — структурированный отчёт в формате:
1. Краткое саммари;
2. Ключевые решения;
3. Задачи с владельцами и сроками;
4. Риски и блокеры.
Тон — деловой, без воды. Опирайся только на содержание транскрипта, не выдумывай.»

Параметры. temperature 0.2, top_p 0.5 (минимум креативности — нужна точность), max 4 000 токенов на выход. В базе знаний — регламенты компании и шаблон протокола.

Failover на демо. В прямой трансляции вебинара GPT-5 задумался на 30+ секунд (бывает). Переключение на Claude Sonnet 4.5 — три секунды, получили саммари. Это и есть бытовой плюс мульти-модельной архитектуры: не сломалось ничего, пользователь сменил модель в выпадающем списке и пошёл дальше.

Ассистент 2 — HR-онбординг

Задача. Новый сотрудник в первый день не знает, к кому подходить с какими вопросами. К HR? К непосредственному руководителю? Кто отвечает за выдачу техники, доступа к корпоративным сервисам, оформление пропусков? Раньше — час бегал и спрашивал. Теперь — пишет в ассистента.

База знаний ассистента. регламенты компании, оргструктура, описания процессов, FAQ для новичков. Системный промпт жёстко ограничивает поведение: отвечай только на основе приложенных документов. Если ответа в базе нет — честно говори «не знаю» и направляй к конкретному сотруднику (имя, должность, контакт). Не выдумывай.

Эта последняя инструкция — критичная. Главный риск LLM в корпоративе — склонность сотрудника безоговорочно доверять модели (то, что в литературе называют «automation bias»). Известны случаи, когда модели советовали ядовитые грибы в кулинарной выдаче. В корпоративном онбординге галлюцинация про «зарплата выдаётся 25-го числа» (а на самом деле 10-го) — это уже инцидент. Поэтому в системных промптах HR-ассистентов мы явно прописываем поведение «при отсутствии ответа — переадресовать живому человеку».

Ассистент 3 — цифровой двойник CEO (ранний эксперимент)

Самый необычный кейс. Идея пришла с одной из конференций по ИИ, где один из руководителей сказал фразу, которая запомнилась: «Ко мне не приходят люди, которые не обсудили идею с моим цифровым двойником сначала».

Звучит провокационно, но логика здравая. CEO — самый дорогой ресурс компании. Большинство встреч с ним съедают время на сырые, недоработанные идеи. Замысел: если перед встречей сотрудник прогонит идею через ассистента, обученного на материалах CEO (книги, статьи, публичные выступления, внутренние стратегические документы), — он получит первичную обратную связь в тональности руководителя, отшлифует слабые места и придёт к настоящей встрече подготовленным.

Технически это тот же ИИ-ассистент: инструкция «отвечай от первого лица, основываясь только на материалах автора», база знаний из текстов CEO, температура 0.2. На выходе — собеседник, который «думает» в логике конкретного человека.

Статус. Здесь честная оговорка: это раннее внедрение, и измеряемых бизнес-метрик по нему у нас пока нет — только качественные сигналы от первых пользователей. Поэтому кейс показываю как формат, а не как результат; цифры по экономии времени CEO и качеству предварительной проработки идей соберём в следующих итерациях.

Что мы поняли за год работы

Урок 1: агрегатор моделей — это не продукт, а инфраструктура. Сам по себе доступ к 42 LLM в одном окне не превращается в бизнес-ценность. Он становится ею только когда обвешан слоем продуктового UX: библиотека шаблонов, обучение, ассистенты под конкретные процессы.

Урок 2: метрика «92% новичков не делают первый запрос» — сигнал не про юзеров, а про продукт. Активные пользователи и ветераны ведут себя одинаково (~4,5 запроса за визит). Разрыв — только в шансе пройти через первое касание. Чинить нужно вход, а не уговаривать пользователя стараться сильнее.

Урок 3: 152-ФЗ — не блокер, а фильтр. Когда мы начинали, требование «всё в российском контуре» казалось ограничением. Оказалось — конкурентным преимуществом. Крупные клиенты не рассматривают для корпоративного внедрения никакие международные сервисы; рынок остался за теми, кто играет по местным правилам.

Что дальше:

Расшаривание шаблонов промптов и ассистентов внутри команды — сейчас и то, и другое видно только создателю; снимаем это ограничение в ближайших релизах.
Агент для генерации презентаций — на основе свежего поколения моделей для изображений.

Если у вас сейчас стадия «пилоты есть, промышленной эксплуатации нет»

Частый блокер — не в технологии. Технологии работают. Блокер — в продуктовом слое между инструментом и сотрудником: библиотека готовых сценариев, обучающие модули, ассистенты под конкретные процессы. Это та работа, которую невозможно сделать за полгода до запуска — она доращивается по живой обратной связи от пользователей.

Посмотреть, как это устроено у нас, и протестировать платформу можно на my.alpinagpt.ai — там есть пробный доступ с обучающими сценариями. Если хочется обсудить ваш конкретный кейс внедрения — пишите команде через форму на сайте.

За тем, как развивается продукт и какие мероприятия проводит Alpina Digital по теме ИИ, — можно следить в Telegram-канале «Дело в промпте».

ссылка на оригинал статьи https://habr.com/ru/articles/1043654/