Архитектура агрегатора из 42 моделей, разбор воронки первого касания и измеренная экономия часов на маркетинге книгоиздания.
Павел Путинцев, продакт-менеджер Альпина GPT (Alpina Digital), ex-куратор курса “ИИ в действии: как эффективно решать бизнес-задачи с помощью нейросетей. Физфак МГУ + KAUST (магистратура по компьютерным наукам). Канал в Telegram: «Дело в промпте» .

Маркетинг в книгоиздании с ИИ — экономия в человекочасах
В апреле 2026 года 92% новых пользователей Альпина GPT уходили с платформы, не сделав ни одного запроса к модели. У возвратных пользователей эта доля — 58%. И это не про «глупых юзеров» — это про сломанный продуктовый механизм: корпоративный агрегатор ИИ без встроенного обучения превращается в дорогую витрину.
Мы построили Альпина GPT — внутренний стартап Alpina Digital, который сегодня собрал 42 модели в одном окне и 9 000 зарегистрированных пользователей. Параллельно — сами на себе замерили эффект: маркетинг книгоиздания через эту платформу освободил 1 425–1 977 человекочасов в год.
Дальше — без рекламы: как устроена архитектура, что сломалось в первой версии, какие три типа ИИ-агентов реально работают в проекте и почему «просто дать доступ к ChatGPT» — это самая дорогая ошибка корпоративного внедрения.
Зачем нам понадобился свой агрегатор
Издательская группа Альпина — крупнейшая универсальная независимая издательская группа в России. И у нас не только книги, но и онлайн-курсы с корпоративными образовательными продуктами. Когда в 2024 году команда массово полезла в нейросети, мы упёрлись в три стены, знакомые любому российскому CTO.
Стена 1 — биллинг и платежи. Корпоративный ChatGPT нельзя оплатить с российского юрлица. VPN — это не решение для 200+ сотрудников.
Стена 2 — данные. Книгоиздательство работает с авторскими правами, неопубликованными рукописями, контрактами. Лить это в облако к OpenAI напрямую — не вариант. 152-ФЗ обязывает хранить персональные данные на серверах в РФ.
Стена 3 — модельный зоопарк. Для разных задач — разные модели. Claude хорош в длинном анализе, GPT — в коде, Perplexity — в фактах со ссылками. Заводить 5 подписок, 5 интерфейсов, 5 логинов — это операционный ад.
Так появилась идея Альпина GPT — один интерфейс, единый биллинг, российский контур, доступ ко всем актуальным моделям через API. Сначала — для своих, потом — для рынка.
Под капотом: 42 модели, ручной выбор и почему мы не делали автороутинг
Сейчас в Альпина GPT 42 модели в активном пуле — от лёгких и быстрых для черновой переписки до тяжёлых reasoning-моделей под аналитику и код. Под каждый класс задач — свой инструмент.
Где живут данные. Selectel + Yandex Cloud, два независимых провайдера для диверсификации рисков. Соответствие 152-ФЗ. Внешние модели подключены через API — данные пользователя не остаются на стороне OpenAI / Anthropic / Google и не используются для дообучения моделей. Доступа к содержимому переписок не имеем даже мы.
Биллинг — Альпина-токены. Внутренняя валюта с относительной шкалой стоимости от 1 до 5 баллов на запрос. Условно: nano-модель — 1 балл, Opus — 5 баллов. Это спрятанная сложность: у каждого API-провайдера своя токенизация, свои цены за вход и выход, своя длина контекстного окна. Сводить это в одну понятную метрику для пользователя — отдельная инженерная задача.
Главное архитектурное решение: автороутинг мы не делали. Модель выбирает сам пользователь.
Это контринтуитивно. Все «умные» агрегаторы в мире сейчас идут в сторону «вы только пишите запрос, мы сами подберём LLM». Мы сознательно пошли в другую сторону — по двум причинам.
Первая — техническая. Качественный роутинг требует ещё одной модели-классификатора, которая на входе решает, какая LLM подойдёт. Это плюс задержка, плюс свои ошибки классификации, плюс непрозрачность для пользователя — «почему мне ответил Gemini, я хотел Claude».
Вторая — продуктовая. Если пользователь не понимает, какая модель ему отвечает, он не учится. А (см. следующую секцию) обучение — это в нашей бизнес-модели ключевая часть продукта, а не «приятное дополнение».
Failover при этом работает — на демо это видно постоянно: GPT-5 завис на 30 секунд, пользователь переключается на Claude Sonnet 4.5, получает ответ за две секунды. Архитектура одного окна делает это переключение бесшовным.
On-premise. Для клиентов с жёсткими требованиями по контуру у нас отдельное решение — платформа разворачивается внутри корпоративной сети заказчика, без обращений к внешним API. Это уже не «commodity AI», а инфраструктурный продукт.
Первая итерация: упёрлись в проблему «пустого окна»
Первые продажи стартовали ещё в конце 2024 года. Тогда продукт выглядел иначе — сырой, тяжёлый, c интерфейсом, к которому стыдно было приводить нового клиента. Мы накапливали обратную связь, перерабатывали платформу и в августе 2025-го выкатили полный ребрендинг плюс открыли публичный доступ для физлиц. С этого момента трафик в Метрике начал расти ощутимо — и за ним же вылезла та самая проблема, которую внутри корпоративного контура мы недооценивали.
Новый пользователь приходил, регистрировался, заходил в чат — и закрывал вкладку через минуту. Уровень бесплатного триала (100 токенов & 3 дня — без промокода) выгорал у активного юзера за день. Но у «активных» — это была меньшая часть.
Большинство залогинивалось, видело пустое поле ввода и не понимало, что в него писать. Это классическая проблема ChatGPT-подобных интерфейсов, перенесённая в корпоративный контекст. У ChatGPT её хотя бы маскирует огромное количество онлайн-туториалов и личная мотивация пользователя «попробовать модную штуку». В корпоративном продукте, который сотруднику прислал HR или ИТ-департамент, — этой мотивации нет.
Что говорят цифры
Голословно про «пустое окно» можно говорить долго. Поэтому я залез в нашу аналитику и достал точные числа — чтобы и сам диагноз поставить корректно, и читатель мог проверить логику.
Источник данных.
Яндекс.Метрика. Период — апрель 2026 года, последний полный календарный месяц. Ключевая цель — model_used, срабатывает при каждом запросе пользователя к любой из 42 моделей. Сегментация — стандартная разбивка Метрики на новых и возвратных пользователей.
|
Сегмент |
Визитов |
Визитов с запросом |
Конверсия |
Запросов за активный визит |
|
Новые пользователи |
5 120 |
393 |
7,7 % |
4,46 |
|
Возвратные пользователи |
12 560 |
5 298 |
42,2 % |
4,48 |
|
Всего |
17 680 |
5 691 |
32,2 % |
4,48 |
Что из этого следует
Главный разрыв — в конверсии в первый запрос: 7,7% у новичков против 42,2% у возвратных. Это разрыв в 5,5 раз в шансе вообще дойти до первого использования.
Но дальше — самое интересное. Те новички, которые всё-таки прорываются к первому запросу, дальше ведут себя точно так же, как ветераны: ~4,5 запроса за визит. Разница между сегментами в интенсивности работы — нулевая (4,46 vs 4,48).
Это качественно меняет диагноз. Проблема — не в том, что «новички плохо умеют пользоваться ИИ» и им надо подтянуть навык. Проблема исключительно в барьере первого касания: 92% новых пользователей не доходят до запроса №1. Если барьер пройден — пользователь сразу работает в полный ход.
Перевожу на язык бизнеса: из 100 новых пользователей 92 не пробуют ни одного запроса в первый визит. Если ничего не делать — большинство из них не вернётся никогда. Это и есть «дорогая витрина»: лицензии куплены, серверы оплачены, а реальная экономика продукта строится на тех 8%, кто как-то самостоятельно прорвался через пустое окно.
Был ещё подкласс той же проблемы — UX-баг с полем «Промокод». Новички его пропускали и попадали в триал на 100 токенов вместо 1 000. Поле переделали — стало нагляднее. Но это копеечный фикс. Главная проблема была не в нём, а в том самом «первом касании».
Что встроили: библиотека промптов, курс и AI Academy
Решение оказалось не техническим, а продуктовым. Раз диагноз — «барьер первого касания», то и лечить надо именно его: дать новичку готовый сценарий, в который не нужно «придумать идеальный промпт». Мы достроили рядом с ядром платформы три обучающих модуля.
Библиотека промптов. Каталог готовых шаблонов под типовые корпоративные задачи: написать пост для соцсетей, сделать саммари встречи, проанализировать отчёт, подготовить ТЗ для подрядчика. Пользователь не пишет с нуля — он выбирает близкий шаблон, заполняет 2–3 переменные и отправляет. Точка входа для новичка снижается с «придумай идеальный промпт» до «выбери из меню». На дорожной карте — расшаривание шаблонов внутри команды (сейчас приватные).
Встроенный курс “ИИ в действии”: как эффективно решать бизнес-задачи с помощью нейросетей. Последний поток стартовал 6 апреля 2025 года и завершил серию из четырёх потоков, проведённых за год. Это не вебинар про «что такое нейросети», а практический интенсив: пользователь параллельно работает в Альпина GPT и проходит структурированные задания. Метрики курса считаем по тем же воронкам — выпускник курса в среднем делает в 3–5 раз больше запросов в месяц, чем неучаствовавший пользователь.
AI Academy. Постоянная программа: цикл вебинаров, разборы кейсов, разборы новых функций платформы. Бесплатно для зарегистрированных пользователей. Это удерживающий контур — выпускник курса попадает не в пустоту, а в регулярный поток обновлений.
Через несколько недель после того, как обучающие модули и шаблоны стали частью пользовательского пути, конверсия в первый запрос у новичков поползла вверх. Точные цифры покажу в следующем материале — там это требует отдельного разбора. Здесь важна сама конструкция: библиотека готовых сценариев + учебный поток + регулярные вебинары — это не «маркетинг вокруг продукта», а часть продукта, без которой агрегатор моделей не доезжает до пользователя.
Кейс №1: маркетинг книгоиздания на собственной платформе — минус 1 977 часов в год
Главный внутренний кейс — мы измерили эффект на самих себе, на маркетинг-команде издательской группы Альпина, которая занимается продвижением книг.
Что было до. Команда вручную писала четыре типа контента: посты в соцсети, статьи на сайт и партнёрские площадки, презентации для авторов и партнёров, рекламные аннотации для каждой выпускаемой книги. Издательство выпускает десятки книг в год, и на каждую — свой контент-пакет. Это съедало большую часть редакторских часов.
Что сделали. Под каждый тип контента собрали ИИ-ассистента в Альпина GPT с инструкцией, базой знаний (стиль издательства, целевые аудитории, успешные референсы) и параметрами генерации. Маркетолог не пишет с нуля — он даёт ассистенту вводные (название книги, аудитория, ключевые тезисы), получает черновик, дорабатывает и публикует.
Результаты за год (расчёт от внутреннего замера):
|
Тип контента |
Без ИИ, ч/год |
С ИИ, ч/год |
Экономия |
Кратность |
|
Посты |
~370 |
~100 |
~270 ч |
×3,7 |
|
Статьи |
~130 |
~50 |
~80 ч |
×2,6 |
|
Презентации |
~250 |
~100 |
~150 ч |
×2,5 |
|
Рекламные аннотации |
~1 000 |
~50 |
~950 ч |
×20 |
|
Итого |
~1 750 |
~300 |
1 425–1 977 ч |
×5,8 |
Самый драматичный кейс — рекламные аннотации (короткие тексты под каждое издание для маркетплейсов, рекламы, партнёрских материалов). Раньше — час на одну, теперь — 3 минуты на черновик и 5 минут на редактуру. На каталоге в сотни книг это экономия в 20 раз.
Важная оговорка для скептиков: эти часы не «исчезли в воздухе». Они высвободились под более сложную работу — стратегическое планирование контент-плана, переговоры с инфлюенсерами, нестандартные кампании. Контент-команда не сократилась, она сменила фокус.
Кейс №2: три рабочих ИИ-ассистента, которые встроились в ежедневные процессы
Помимо контента, мы встроили в работу команды трёх ассистентов другого класса. Не «помоги написать», а «выполни структурированную задачу».
Ассистент 1 — Помощник руководителя проектов
Задача. Проект-менеджер получает запись 60-минутного созвона с клиентом или внутренней команды. Раньше — час сидит, расшифровывает, выписывает решения, рассылает протокол. Сейчас — загружает аудио в ассистента и получает структурированный документ.
Системный промпт (упрощённо). «Ты — помощник руководителя проектов Apollo. На входе — транскрипт встречи. На выходе — структурированный отчёт в формате:
1. Краткое саммари;
2. Ключевые решения;
3. Задачи с владельцами и сроками;
4. Риски и блокеры.
Тон — деловой, без воды. Опирайся только на содержание транскрипта, не выдумывай.»
Параметры. temperature 0.2, top_p 0.5 (минимум креативности — нужна точность), max 4 000 токенов на выход. В базе знаний — регламенты компании и шаблон протокола.
Failover на демо. В прямой трансляции вебинара GPT-5 задумался на 30+ секунд (бывает). Переключение на Claude Sonnet 4.5 — три секунды, получили саммари. Это и есть бытовой плюс мульти-модельной архитектуры: не сломалось ничего, пользователь сменил модель в выпадающем списке и пошёл дальше.
Ассистент 2 — HR-онбординг
Задача. Новый сотрудник в первый день не знает, к кому подходить с какими вопросами. К HR? К непосредственному руководителю? Кто отвечает за выдачу техники, доступа к корпоративным сервисам, оформление пропусков? Раньше — час бегал и спрашивал. Теперь — пишет в ассистента.
База знаний ассистента. регламенты компании, оргструктура, описания процессов, FAQ для новичков. Системный промпт жёстко ограничивает поведение: отвечай только на основе приложенных документов. Если ответа в базе нет — честно говори «не знаю» и направляй к конкретному сотруднику (имя, должность, контакт). Не выдумывай.
Эта последняя инструкция — критичная. Главный риск LLM в корпоративе — склонность сотрудника безоговорочно доверять модели (то, что в литературе называют «automation bias»). Известны случаи, когда модели советовали ядовитые грибы в кулинарной выдаче. В корпоративном онбординге галлюцинация про «зарплата выдаётся 25-го числа» (а на самом деле 10-го) — это уже инцидент. Поэтому в системных промптах HR-ассистентов мы явно прописываем поведение «при отсутствии ответа — переадресовать живому человеку».
Ассистент 3 — цифровой двойник CEO (ранний эксперимент)
Самый необычный кейс. Идея пришла с одной из конференций по ИИ, где один из руководителей сказал фразу, которая запомнилась: «Ко мне не приходят люди, которые не обсудили идею с моим цифровым двойником сначала».
Звучит провокационно, но логика здравая. CEO — самый дорогой ресурс компании. Большинство встреч с ним съедают время на сырые, недоработанные идеи. Замысел: если перед встречей сотрудник прогонит идею через ассистента, обученного на материалах CEO (книги, статьи, публичные выступления, внутренние стратегические документы), — он получит первичную обратную связь в тональности руководителя, отшлифует слабые места и придёт к настоящей встрече подготовленным.
Технически это тот же ИИ-ассистент: инструкция «отвечай от первого лица, основываясь только на материалах автора», база знаний из текстов CEO, температура 0.2. На выходе — собеседник, который «думает» в логике конкретного человека.
Статус. Здесь честная оговорка: это раннее внедрение, и измеряемых бизнес-метрик по нему у нас пока нет — только качественные сигналы от первых пользователей. Поэтому кейс показываю как формат, а не как результат; цифры по экономии времени CEO и качеству предварительной проработки идей соберём в следующих итерациях.
Что мы поняли за год работы
Урок 1: агрегатор моделей — это не продукт, а инфраструктура. Сам по себе доступ к 42 LLM в одном окне не превращается в бизнес-ценность. Он становится ею только когда обвешан слоем продуктового UX: библиотека шаблонов, обучение, ассистенты под конкретные процессы.
Урок 2: метрика «92% новичков не делают первый запрос» — сигнал не про юзеров, а про продукт. Активные пользователи и ветераны ведут себя одинаково (~4,5 запроса за визит). Разрыв — только в шансе пройти через первое касание. Чинить нужно вход, а не уговаривать пользователя стараться сильнее.
Урок 3: 152-ФЗ — не блокер, а фильтр. Когда мы начинали, требование «всё в российском контуре» казалось ограничением. Оказалось — конкурентным преимуществом. Крупные клиенты не рассматривают для корпоративного внедрения никакие международные сервисы; рынок остался за теми, кто играет по местным правилам.
Что дальше:
-
Расшаривание шаблонов промптов и ассистентов внутри команды — сейчас и то, и другое видно только создателю; снимаем это ограничение в ближайших релизах.
-
Агент для генерации презентаций — на основе свежего поколения моделей для изображений.
Если у вас сейчас стадия «пилоты есть, промышленной эксплуатации нет»
Частый блокер — не в технологии. Технологии работают. Блокер — в продуктовом слое между инструментом и сотрудником: библиотека готовых сценариев, обучающие модули, ассистенты под конкретные процессы. Это та работа, которую невозможно сделать за полгода до запуска — она доращивается по живой обратной связи от пользователей.
Посмотреть, как это устроено у нас, и протестировать платформу можно на my.alpinagpt.ai — там есть пробный доступ с обучающими сценариями. Если хочется обсудить ваш конкретный кейс внедрения — пишите команде через форму на сайте.
За тем, как развивается продукт и какие мероприятия проводит Alpina Digital по теме ИИ, — можно следить в Telegram-канале «Дело в промпте».
ссылка на оригинал статьи https://habr.com/ru/articles/1043654/