Суверенный AI — это архитектурный подход, при котором данные, инфраструктура и языковые модели находятся под российской юрисдикцией и соответствуют требованиям 152-ФЗ. Это включает локализацию хранения персональных данных на территории РФ, инференс на отечественных или open-weights моделях и запуск всех сервисов на инфраструктуре, подконтрольной российскому оператору.
Для PR-агентств и пресс-служб, работающих с конфиденциальными релизами и медиабазами, это не опция — это требование.
Совпали три тренда. Первое — регуляторное давление: усиление надзора Роскомнадзора, рост штрафов за трансграничную передачу персональных данных, прецеденты блокировки сервисов за несоответствие 152-ФЗ. Второе — геополитический контекст: ограничение доступа к зарубежным облачным провайдерам (AWS, Azure, GCP), официальное отсутствие OpenAI и Anthropic API в РФ, нестабильность foreign-эндпоинтов даже там, где формально доступ есть. Третье — зрелость отечественного стека: GA-релизы Yandex Cloud GenAI, YandexGPT 5, доступность open-weights моделей Qwen 3 и Llama 3 на российских GPU-инстансах. Впервые возможно построить суверенный стек без потери качества — раньше это был выбор «соответствие или функциональность», сейчас уже нет.
Это окно — построить суверенную AI-инфраструктуру можно сейчас, не дожидаясь, пока регуляторное давление сделает это аварийной задачей.
Пятислойная модель. Каждый слой решает одну задачу, между ними — чёткие границы данных. Граница периметра проходит по этим слоям: всё, что обрабатывает ПД, должно находиться внутри российского периметра целиком.
Три модели развёртывания, каждая со своим компромиссом стоимости, скорости и соответствия. Ключевой вопрос — обрабатываются ли в системе ПД граждан РФ. Если да — третий столбец. Если нет — первые два открыты, выбор зависит от стоимости и стратегической независимости от вендора.
| Критерий | Cloud SaaS (зарубежный) | Гибрид (RU-cloud + foreign API) | Self-hosted на RU |
|---|---|---|---|
| Локализация ПД | Нарушает 152-ФЗ | Частично — зависит от пайплайна | Соответствует |
| Стоимость (CAPEX) | Низкий | Средний | Высокий |
| Стоимость (OPEX) | Средний или высокий | Средний | Низкий после развёртывания |
| Качество моделей | Frontier (GPT-4, Claude) | Frontier для read-only задач | Open-weights (Qwen, YandexGPT) |
| Время до запуска | Дни | Недели | Месяцы |
| Зависимость от вендора | Высокая | Средняя | Низкая |
| Подходит для | Прототипы, не-PII | Аналитика обезличенных данных | Production с ПД |
Гибридная модель работает там, где удаётся обезличить данные на этапе извлечения. Для production-обработки персональных данных юридически работает только третий столбец.
Что считается персональными данными (ст. 3): любая информация, прямо или косвенно идентифицирующая физическое лицо — включая email, телефон, фото, голос, поведенческие данные. Промпт, в котором эксперт цитирует материал клиента с именем спикера, — это обработка ПД.
Принцип первичного хранения (ст. 18 ч. 5): запись, систематизация, накопление, хранение, уточнение и извлечение ПД должны выполняться через базы данных, расположенные на территории РФ. Это не «бэкап в РФ» — это первичный мастер-источник.
Трансграничная передача (ст. 12): требует согласия субъекта или попадания страны в утверждённый перечень. США, ЕС после 2022 года в перечне отсутствуют.
Роль AI-вендора: компания, обрабатывающая ПД для решения задач клиента, является оператором или лицом, осуществляющим обработку. Обе роли несут полные обязанности по 152-ФЗ.
Распространённое заблуждение: «модель не видит ПД, она видит только эмбеддинг». Это не работает юридически — эмбеддинг ПД сам является обработкой ПД, и промпт, передаваемый в LLM, тоже. Любой шаг пайплайна, через который проходит ПД, регулируется законом.
Позиция Роскомнадзора по LLM-сервисам: в публичных разъяснениях 2025 года передача промптов с ПД зарубежным API-эндпоинтам квалифицируется как трансграничная передача ПД. Это закрывает «удобный» сценарий «прокинем через API в OpenAI» как способ обхода — он формально нарушает закон.
Кельва строит AI-инфраструктуру с суверенностью как архитектурным значением по умолчанию, а не как опцией развёртывания. Это означает, что любой наш продукт может быть развёрнут в полностью российском периметре без переписывания кода — отличается только конфигурация инфраструктуры, не сама система.
Полный self-hosted стек на Yandex Cloud (ru-central1). Данные, эмбеддинги, инференс — всё в российском периметре. Single-tenant развёртывание для каждого клиента.
По умолчанию работают на оптимальной для качества инфраструктуре. Для enterprise-контрактов разворачиваются в полностью суверенной конфигурации без изменений в коде. Архитектурно подготовлены к swap-out зарубежных моделей на YandexGPT или Qwen self-hosted.
Это намеренно: каждый продукт Кельвы поддерживает суверенное развёртывание.
(пусто — все продукты Кельвы поддерживают суверенное развёртывание)
Для PR-агентства, обслуживающего клиента из регулируемой отрасли, это не маркетинговая фраза — это решение, можно ли вообще использовать AI-инструмент в работе.
Если вы оцениваете AI-инструмент для PR-агентства или пресс-службы и вопрос соответствия 152-ФЗ стоит на повестке — поговорим о том, как построить суверенное решение под вашу задачу.
Связаться с командой