Ключевые тезисы
- •Демо-генератор и production-продукт разделяют 6 инфраструктурных слоёв: контекст темы, профиль спикера, версионируемые промпты, аудит, интеграции, compliance-check
- •Главный production-слой — не AI-качество, а согласование от лица спикера и аудит изменений; в демо этого нет
- •Промпты в production живут в git с PR-ревью, не как «настройка интерфейса» — иначе через 3 месяца команда теряет контроль
- •AI-инструмент без интеграции с существующим пайплайном PR-команды (CRM, Slack, Google Docs) превращается в ещё один отдельный сайт
- •Граница «демки достаточно» проходит на этапе «инструментом пользуется регулярно больше одного человека» — после этого инфраструктурные слои обязательны
На конференциях 2025-2026 годов любой второй AI-стартап показывает «генератор медиакомментариев» — поле ввода темы, дропдаун спикеров, кнопка «сгенерировать». Это всё демо. До production эту демку отделяют шесть инфраструктурных слоёв, каждый из которых ломается в первые три месяца, если не учтён в архитектуре. Этот текст — про то, что мы построили вокруг [Генератора медиакомментариев](/products/media-comment-generator), и про конкретные точки слома, через которые проходит каждое внедрение.
Что показывают в демо
Типичная демо-постановка занимает 90 секунд:
- Журналист написал запрос на комментарий («Прокомментируйте рост рынка X»).
- PR-менеджер открывает интерфейс, выбирает в дропдауне спикера, вставляет запрос журналиста.
- Нажимает «сгенерировать».
- LLM выдаёт абзац с цитатой от лица спикера. Стилистически правильный, фактически правдоподобный.
- Менеджер копирует, отправляет журналисту.
Это работает на сцене. Это не работает в работе. Между демо и production стоят шесть слоёв, которые в презентации скрываются за «у нас интеграции в роудмапе».
Слой 1. Контекст темы — а не только формулировка запроса
В демо журналист написал «прокомментируйте рост рынка X». В жизни запрос звучит так: «привет, пишу материал про последствия повышения ключевой ставки для МСП, у вас есть данные по динамике обращений за кредитами в первой половине года, и можно ли цитировать главу департамента розничного блока». Это совсем другой объём контекста, и без него комментарий не имеет смысла.
Что нужно в production: перед генерацией система собирает контекст темы — что компания публиковала на эту тему за последние 6-12 месяцев, какие позиции уже артикулировались в публичных выступлениях, какие данные доступны для цитирования. Это RAG-слой по корпоративному контенту, не «генерация по теме».
В нашем продукте этот слой подключён к корпоративной базе знаний клиента (Notion, Confluence, SharePoint или собственная база) через индексирующий воркфлоу. Без него комментарий генерируется правдоподобно, но не привязан к реальной позиции компании — и его нельзя выпустить.
Слой 2. Спикер — не только имя в дропдауне
«Прокомментировал глава розничного блока банка Х» — это публикация под именем человека, который должен быть согласен с тем, что напечатано. В демо этот шаг пропущен; в работе он критичен.
Что нужно в production:
- Профиль спикера в системе — какие темы он комментирует, какие нет, в каком тоне, каких формулировок избегать
- История прошлых комментариев — чтобы не повторяться и не противоречить
- Регламент согласования — комментарий от лица спикера требует его подтверждения; в системе это явный шаг, не «сгенерировал и отправил»
- Цвет шкалы доверия — для каких тем спикер автоматически утверждает, для каких — нужно ручное согласование, какие — только лично
Без этих параметров продукт работает «технически» (текст генерируется), но юридически и репутационно — это мина замедленного действия. Один комментарий, отправленный без согласования, в чувствительной теме, может стоить отношений с клиентом.
Слой 3. Промпт — версионируемый артефакт
В демо промпт зашит в код. В production это самый часто меняющийся компонент.
PR-команда замечает: текущая формулировка генерирует слишком формальный тон → надо смягчить. Через две недели: комментарии для отраслевой прессы и для общих СМИ должны звучать по-разному → нужна сегментация. Через месяц: появился новый клиент с другим стилем → нужен per-client override промпта.
Что нужно в production:
- Промпты живут в git, не в коде продукта
- Версионируются по клиентам, по типам изданий, по типам тем
- Изменения проходят PR-ревью — потому что промпт это часть продукта
- Есть staging-инстанс продукта, где новый промпт тестируется на 5-10 типовых запросах до prod
Это полностью аналог CI/CD для кода. Команды, которые относятся к промптам как к «настройке», получают комментарии, которые меняются непредсказуемо после любой правки.
Слой 4. Аудит — кто, когда, почему
PR-материалы могут попасть в юридическую проверку. «Кто согласовал этот комментарий, в какой версии, на основе какого запроса журналиста» — стандартный вопрос юриста через 6 месяцев после публикации, когда возник конфликт.
Что нужно в production:
- Каждая генерация залогирована — кто инициировал, какой промпт версии X, какой запрос журналиста, какой контекст подгружен
- История изменений комментария — кто правил, что правил, когда
- Связь с публикацией — где этот комментарий вышел, был ли изменён редакцией
- Экспорт лога в формате, который понимает юридическая команда (PDF, не JSON dump)
Это не «nice to have». В B2B PR-агентствах работающих с регулируемыми отраслями (банки, фарма, телеком, энергетика) — это требование контракта.
Слой 5. Интеграции с пайплайном PR-команды
Команда уже работает с инструментами — CRM с базой журналистов, Slack/Telegram для координации, Google Docs для согласования с клиентами, какая-то система отправки писем. AI-продукт без интеграции в этот пайплайн — это ещё один отдельный сайт, в который заходит один человек.
Что нужно в production:
- Получение запроса журналиста — через email-парсер, Slack-команду или интеграцию с CRM
- Уведомление спикера — через Telegram, email или нативный workflow в CRM
- Согласованный комментарий → Google Docs автоматически, со связью на запись в CRM
- Отправка финальной версии журналисту — через тот же канал, по которому пришёл запрос
В нашем Генераторе медиакомментариев эта прослойка реализована через n8n. Это позволяет каждому клиенту иметь свой набор интеграций — у одних HubSpot, у других Bitrix24, у третьих просто Notion + почта.
Слой 6. Качество — не «выглядит правильно», а «соответствует политике»
Самый недооценённый слой. Текст может быть стилистически безупречным, фактически корректным — и не подходить для публикации из-за невидимых нюансов: упомянутый конкурент, рискованная формулировка о регуляторе, цитата, которая в текущем политическом контексте чувствительна.
Что нужно в production:
- Список «red-flag слов» по каждому клиенту, проверяемый автоматически
- Список «никогда не комментируем» тем — система отказывается генерировать, если запрос подпадает
- Compliance-check на чувствительные категории (политика, регулятор, конкурент) — если флаг сработал, ручное согласование обязательно
- Семантическая проверка тон — слишком утвердительный, слишком оборонительный, слишком технический
Это не AI-magic; это структурированная проверка по правилам, которые задаёт клиент при онбординге. В демо этих правил нет — комментарий уходит «как есть».
Что обычно ломается на третий месяц
После запуска внедрения система работает первый месяц хорошо — задачи новые, команда внимательная. На третий месяц появляются точки слома:
Дрейф промпта. Один из членов команды правит промпт «на лету» без ревью, чтобы исправить разовый недочёт. Изменение остаётся, но ломает другие сценарии. Через месяц комментарии звучат странно, никто не помнит почему.
Профили спикеров устаревают. Сотрудник сменил позицию, ушёл, начал комментировать новые темы — а в системе осталось старое. Кто-то генерирует комментарий, который физически невозможно опубликовать.
Расходы выросли. Подключили нового клиента, объём запросов вырос, per-token billing OpenAI API ушёл в значительные деньги. Кто-то предложил «временно» использовать ChatGPT через интерфейс — это конец compliance.
Логи переполнились. За три месяца накопилось десятки тысяч генераций, никто не настроил ротацию и архивацию. Поиск конкретной генерации занимает 20 минут.
Это всё прогнозируемые проблемы. В демо они отсутствуют. В production-стеке они решаются заранее — этим и отличается продукт от прототипа.
Что измеряем как успех внедрения
«AI работает» — слишком общая формулировка. В работе мы используем три метрики, по которым видно, что система реально интегрирована в работу команды, а не висит в углу:
Time-to-publish. Сколько часов от поступления запроса журналиста до отправки финальной согласованной версии. Без AI на крупных PR-задачах это типично 6-24 часа. Цель внедрения — 1-4 часа на типовой запрос, до 8 часов на чувствительные темы. Если через 2 месяца после запуска эта цифра не сдвинулась — внедрение провалилось, нужно искать слом в одном из шести слоёв.
Ratio согласованных без правок. Какой процент сгенерированных комментариев спикер согласует без редактирования или с минимальными правками. Стартовый уровень для нового клиента — 40-60% (промпт ещё калибруется, профили спикеров узнаются). Через 2-3 месяца итерации промптов цель — 70-85%. Ниже 50% после трёх месяцев — система не подходит спикерам, нужен пересмотр промпта или регламента.
Compliance-incident rate. Сколько раз за квартал система сгенерировала комментарий, который compliance-фильтр должен был остановить, но пропустил. Цель — ноль. Каждый инцидент разбирается, правила обновляются.
Эти метрики собирает n8n-воркфлоу автоматически и кладёт в дашборд клиента. Если внедрение не предусматривает такого дашборда — это сигнал, что вам пытаются продать дёмо, не продукт.
Когда демо достаточно
Не каждый use case требует production-стека. Когда генератор-как-демка достаточен:
- Пилот на 2-3 недели для проверки полезности самой идеи в команде
- Внутренний инструмент для подготовки черновиков, которые потом всё равно проходят полную ручную обработку
- Учебные сценарии — обучение команды промптингу, knowledge sharing
- Низкочастотные кейсы — несколько раз в месяц, без интеграции в производственный пайплайн
В этих случаях «генератор как сайт с полем ввода» — рабочее решение. Тратить ресурсы на полноценный продакшн-стек до того, как доказана базовая ценность, — антипаттерн.
Граница — момент, когда инструментом начинает пользоваться больше одного человека на регулярной основе. Тогда инфраструктурные слои становятся обязательными.
Закрыть разницу осознанно
Если ваше агентство оценивает AI-генератор для медиакомментариев и сравнивает варианты — поговорим. Мы пройдём по шести слоям выше для конкретного сценария вашей команды и предложим конфигурацию: где можно начать с минимальной демки, что критично с первого дня, а что можно отложить.
Сам продукт — Генератор медиакомментариев — собран как референс-реализация всех шести слоёв на n8n + YandexGPT/Qwen, разворачивается за 2-4 недели под клиента с минимальной кастомизацией.
