Зачем эта запись

К 2024 классификация писем менеджеров через LLM стала рабочим сценарием, а не экспериментом. С тех пор я прошёл с заказчиками всю эволюцию подхода. Сначала был соблазн «давайте позвоним в OpenAI». Потом пришло понимание, что для прод-данных в РФ это тупик, и связка переехала на локальную Qwen в pgvector и российские LLM. RAG над договорами и MCP-сервер из 1С это следующие уровни той же линии.

Эта запись для CIO или владельца компании, которому AI-вендоры обещают «революцию в 1С». Без хайпа. Я разбираю, что закладываю в пилот, что вижу работающим у заказчиков, что падает, и где санкции реально меняют выбор инструмента. Половина пресс-релизов на тему «AI в российском бизнесе» написана так, будто санкций нет.

Это методология, а не отчёт по одному проекту

Сценарии ниже собирательные. Они отражают мой подход и то, что я закладываю в бизнес-кейс на проектах такого масштаба, а не конкретное внедрение у конкретного заказчика. Реальные клиенты под NDA. Конкретные имена, точные бюджеты и узнаваемые детали процессов в публичном поле не появляются.

Все проценты, сроки и объёмы даны диапазонами как порядок величин для потока соответствующего размера. Это не измеренный факт одного проекта. Полностью выдуманный кейс с цифрами «до и после» лежит в отдельной записи про миграцию, он честно помечен иллюстративным.

Два правовых контура AI для 1С

Половина путаницы вокруг «можно ли использовать ChatGPT в 1С» растёт из смешения двух разных контуров. Прод-юр.лицо в РФ и разработчик-физлицо это разные субъекты с разным правовым режимом.

Контур 1. Прод-юр.лицо в РФ

Производственное предприятие, торговая компания, бухгалтерия холдинга. Российское юр.лицо платит в рублях, обслуживает российских клиентов, обрабатывает ПДн граждан РФ (152-ФЗ). Для такого контура доступ к LLM выглядит так.

LLM-доступ из РФ для прод-юр.лица, середина 2026
API	Доступ из РФ	Юридический статус для прода
OpenAI API (ChatGPT, GPT-5.x)	Заблокирован ToS, требует VPN/прокси	Нарушение ToS + риск 152-ФЗ при ПДн
Anthropic Claude API	Заблокирован ToS	То же
Google Gemini API	Заблокирован ToS	То же
YandexGPT (Yandex Cloud)	Полный доступ, оплата в рублях	Лицензионно чисто, договор с резидентом РФ
GigaChat (Сбер)	Полный доступ, оплата в рублях	Лицензионно чисто
Локальные модели (Qwen, Llama, T-lite)	Open-source, любой регион	Полностью под контролем

Правило простое. Данные клиентов, договоры с реальными ИНН, выписки из 1С, ПДн сотрудников отправляются только в YandexGPT, GigaChat или локальную модель. Никаких заокеанских API на проде.

Контур 2. Разработчик 1С

Разработчик-физлицо, ИП, или техническое юр.лицо за пределами РФ (зарегистрированное в Сербии, Армении, ОАЭ, Казахстане). У него другой набор инструментов. Он платит за Claude Pro / GitHub Copilot / Cursor через зарубежную карту или юр.лицо, использует VPN для доступа, и работает с обезличенным кодом BSL без ПДн.

Когда я работал с 1С-командой 5–8 разработчиков в 2018–2023, у нас был чёткий разделитель. Личная разработка и тестовые стенды шли через любой инструмент по выбору программиста. Прод-данные только через российские LLM. Обезличенный BSL-модуль на код-ревью можно отправить в Claude или Copilot, а анализ реального журнала регистрации с ФИО менеджеров и ИНН контрагентов уже нельзя.

Два правовых контура для AI в 1С-разработке и эксплуатации
Сценарий	Что можно	Через что
Личная разработка BSL	Claude / Copilot / Cursor / GPT	Свой ноутбук, VPN, обезличенный код
Code review модуля	Claude / Copilot	Обезличенный BSL без имён юзеров и ИНН
Генерация тестов на модуле	Claude / Cursor	Тестовый стенд, синтетические данные
Прод-классификация обращений	YandexGPT / GigaChat	Yandex Cloud / Сбер, рубли
RAG над договорами клиентов	YandexGPT + pgvector	On-premise, шифрованный backup
Анализ метаданных конфигурации	Локальная Qwen или GigaChat	Сервер компании, без передачи наружу

Это не про «можно мухлевать с VPN». Это про разные правовые субъекты с разной ответственностью. Юр.лицо в РФ не оформит подписку на ChatGPT Team в расходы, не получит закрывающий документ от OpenAI, не предъявит налоговой обоснование платежа. Разработчик-физлицо в Сербии оформит легко.

Что РЕАЛЬНО работает в проде на 2026

Четыре сценария, на которых AI в связке с 1С работает стабильно. Их я разбираю в этой записи и закладываю в пилоты:

Классификация обращений / писем / тикетов.Точность 85–92% на типовых сценариях. Fallback на менеджера. Окупаемость 4–8 месяцев.
RAG над договорами и нормативкой. Поиск по семантике, не по ключевым словам. Юрист или бухгалтер находит нужный пункт за 30 секунд вместо 15 минут.
Голосовые AI-менеджеры на входящих звонках B2B.Asterisk + faster-whisper + LLM + 1С-шлюз. Снимает с первой линии типовую квалификацию на потоке от пары сотен звонков в день.
MCP-сервер из 1С. Стандарт Anthropic от ноября 2024 для интеграции LLM с внешними системами. Внутренний ассистент CIO для запросов «сколько у нас открытых заказов на завод X».

Дальше идёт разбор каждого с конкретикой.

Классификация обращений в B2B-производстве

С этого сценария я обычно начинаю разговор про AI в 1С. У него понятная отдача и низкий риск. Типовая картина в B2B-производстве такая. Менеджеры получают на корпоративную почту порядка сотни писем в день. Запросы цен, спецификации, претензии по поставке, заявки на отгрузку, рекламации. Раньше это раскладывал руками секретарь, и на поток такого объёма уходит порядка двух-трёх часов в день одного человека.

Архитектура

Письма попадают на FastAPI-сервис через IMAP-poll каждые 2 минуты. Сервис отправляет тело письма в GigaChat 2 Pro с промптом «Классифицируй по 7 категориям: цена, спецификация, претензия, заявка, рекламация, общее, спам». Ответ парсится, и в 1С создаётся запись «Обращение» с категорией, привязкой к контрагенту по email-отправителю, и снимком текста.

python
# Упрощённый пример. Полный код у меня в приватном репо.
import httpx
from fastapi import FastAPI, BackgroundTasks
import asyncio

app = FastAPI()

CATEGORIES = [
    "price_request",
    "specification",
    "complaint",
    "order",
    "claim",
    "general",
    "spam",
]

async def classify(text: str) -> str:
    prompt = f"""Классифицируй обращение по категориям: {", ".join(CATEGORIES)}.
Верни ТОЛЬКО код категории, без объяснений.

Текст обращения:
{text[:3000]}"""

    async with httpx.AsyncClient(timeout=30) as client:
        resp = await client.post(
            "https://gigachat.devices.sberbank.ru/api/v1/chat/completions",
            headers={"Authorization": f"Bearer {GIGACHAT_TOKEN}"},
            json={
                "model": "GigaChat-2-Pro",
                "messages": [{"role": "user", "content": prompt}],
                "temperature": 0.1,
                "max_tokens": 30,
            },
        )
    return resp.json()["choices"][0]["message"]["content"].strip()


@app.post("/email")
async def handle_email(email_id: int, body: str, bg: BackgroundTasks):
    category = await classify(body)
    if category not in CATEGORIES:
        category = "general"  # fallback
    bg.add_task(create_appeal_in_1c, email_id, category, body)
    return {"category": category}

Точность и fallback

Порядок точности, на который я закладываюсь в бизнес-кейсе для GigaChat 2 Pro на типовом потоке писем, это 85–92% без дообучения. Остальное это спорные случаи. Письмо одновременно про цену и претензию, или плохо отформатированный пересланный e-mail. На fallback менеджер видит обращение с категорией «общее» и переклассифицирует руками. Дообучение на собственных данных я в пилот сразу не закладываю. Fine-tune через Yandex Cloud стоит денег, и окупаемость на старте не доказана.

Какой эффект я закладываю в бизнес-кейс

Это типовая иллюстрация, на которую я ориентируюсь при оценке пилота, а не отчёт по конкретному внедрению. На потоке около сотни писем в день разбор руками съедает порядка двух-трёх часов рабочего времени. Реалистичная цель после классификатора это свести ручную работу к проверке fallback и спорных случаев, экономия порядка полутора-двух с половиной часов в день.

Освобождённое время уходит на сопровождение заказов. Отдельная ценность в том, что письма перестают теряться. Категорию «order» можно завязать на автосоздание задачи в 1С с дедлайном, и «забыли ответить» уходит как класс проблемы.

RAG над договорами и нормативкой ФСБУ

Типовая боль, под которую я ставлю RAG, выглядит так. Юрист обрабатывает несколько десятков контрагентских договоров в месяц и при этом следит за изменениями ФСБУ и налоговой нормативки. Поиск по ключевым словам в Word-файлах работает плохо. Пропускаются синонимы, не находятся правки в подпунктах.

Архитектура

Все договоры и нормативные акты прогоняются через pipeline:

Извлечение текста. Для DOCX через python-docx, для PDF через pdfplumber.
Чанкование. Нарезка по абзацам с overlap 200 символов. Каждый чанк сохраняет ссылку на исходный документ и номер страницы.
Embeddings через YandexGPT Embeddings (модельtext-search-doc). Размерность 256.
Хранение в pgvector. Расширение PostgreSQL для векторного поиска. Индекс HNSW для скорости.
Поисковый запрос. Юрист пишет «можно ли расторгнуть договор без штрафа при просрочке поставки 14 дней», и сервис эмбедит запрос, ищет 5 ближайших чанков, отдаёт в YandexGPT для генерации ответа с цитатами.

sql
-- Схема pgvector для договоров
CREATE EXTENSION IF NOT EXISTS vector;

CREATE TABLE contract_chunks (
    id BIGSERIAL PRIMARY KEY,
    contract_id INT NOT NULL,
    chunk_text TEXT NOT NULL,
    page_num INT,
    embedding vector(256) NOT NULL,
    created_at TIMESTAMPTZ DEFAULT NOW()
);

CREATE INDEX ON contract_chunks
USING hnsw (embedding vector_cosine_ops);

-- Поиск 5 ближайших чанков к запросу
SELECT contract_id, chunk_text, page_num,
       1 - (embedding <=> $1::vector) AS similarity
FROM contract_chunks
ORDER BY embedding <=> $1::vector
LIMIT 5;

Точность

Качество такого RAG я оцениваю не бенчмарком, а обратной связью юриста. Реалистичный порядок такой. Четыре из пяти запросов дают релевантный результат с первой формулировки, ещё часть со второй попытки. Промахи обычно на очень узких пунктах конкретного договора, который выпал из индекса из-за плохого OCR на сканированной странице.

Главная польза это скорость. Поиск нужного пункта в многостраничном договоре руками занимает четверть часа и больше. RAG отдаёт выдержку с цитатой за секунды.

Голосовые AI-менеджеры на входящих B2B-звонках

Самый технически сложный из четырёх сценариев. Имеет смысл там, где входящий поток в горячий сезон идёт сотнями звонков в день. Первая линия это квалификация. «Вам нужна аренда на час или на сутки?», «по какой дате?», «сколько человек?». Типовая работа, на которой выгорают операторы.

Архитектура

Asterisk. Open-source PBX. Принимает звонок из городской АТС.
faster-whisper. Open-source движок Whisper от OpenAI, портированный на ctranslate2 для скорости. Модельlarge-v3-turbo. На GPU NVIDIA L4 транскрибирует real-time с задержкой 500 мс.
YandexGPT 5 Pro с reasoning отвечает за «мозги» агента. Промпт-инжиниринг с системным сообщением, описывающим бизнес и правила квалификации.
YandexSpeechKit (TTS). Генерация ответа голосом. Натуральные голоса, поддержка SSML.
1С-шлюз FastAPI. После квалификации создаёт обращение в 1С с проставленной категорией, нужной датой, числом людей. Использует idempotency-key, чтобы при retry не плодить дубли.

Что работает, что нет

Что работает. Квалификация по базовым параметрам заявки (дата, тип услуги, число человек, контакт для связи), передача оператору по фразе «соедините с человеком» и создание обращения в 1С.

Что не работает. Сложные согласования по цене и индивидуальным условиям, где AI пасует и передаёт на менеджера. Жалобы и рекламации сразу переключаем на человека, тут эмпатия важнее скорости. На корпоративных тендерах нужна экспертиза, и AI бесполезен.

MCP-сервер из 1С

Model Context Protocol (MCP) это открытый протокол от Anthropic, представлен в ноябре 2024. Позволяет LLM безопасно обращаться к внешним источникам данных и инструментам через типизированные действия. На середину 2026 MCP поддерживают Claude (нативно), Cursor, ChatGPT (через connector), плюс ряд других IDE и ассистентов.

Для 1С MCP-сервер это сервис, который принимает запрос от LLM вида «найди заказы клиента X», обращается к 1С через HTTP-сервисы или OData, форматирует ответ и возвращает LLM. Готовое решение это ARQA MCP Server. Под конкретную площадку я обычно пишу минимальный MCP-сервер на FastMCP (Python SDK от Anthropic), чтобы открыть ровно нужный набор операций.

Зачем это нужно CIO

Два кейса, ради которых я ставлю MCP-сервер:

Внутренний ассистент CIO. Я пишу в Claude Desktop «сколько у нас открытых заказов на завод X с просроченной отгрузкой», и Claude через MCP обращается к 1С, получает выгрузку, форматирует ответ. Не нужно открывать конфигуратор и писать запрос на СКД.
Анализ метаданных 1С. Пишу «какие документы у нас используют регистр накопления Заказы клиентов», и MCP-сервер обходит метаданные конфигурации и возвращает список. Удобно при дискавери на новой площадке.

Безопасность

MCP-сервер это API, к которому имеет доступ LLM. Поэтому обязательно соблюдаю несколько правил.

Развёртывание on-premise, не в облаке. Данные 1С не уходят наружу.
Read-only доступ к 1С. Никаких WRITE-операций из MCP-сервера. Если нужны изменения, делаю отдельный согласованный flow с подтверждением.
Логирование всех запросов с полной трассой. Кто обращался и что именно вернул сервер.
Whitelist метаданных. Не любые регистры и документы видны через MCP, только те, которые я явно открыл.

python
# Минимальный MCP-сервер для 1С на FastMCP
from fastmcp import FastMCP
import httpx

mcp = FastMCP("1c-server")

ODATA_URL = "https://1c.example.com/erp/odata/standard.odata"
AUTH = ("mcp_user", "password_from_vault")

@mcp.tool()
async def find_orders_by_customer(customer_ref: str, status: str = "open") -> list:
    """Найти заказы клиента по ссылке (Ref_Key) с фильтром по статусу.

    Фильтр по реквизиту связанного объекта (Контрагент/ИНН) в OData 1С
    из коробки работает не всегда — синтаксис зависит от версии платформы
    и состава published OData. Надёжнее фильтровать по собственному
    реквизиту документа (ссылке Контрагент_Key), а ИНН разрешать заранее
    отдельным запросом к справочнику.
    """
    async with httpx.AsyncClient(auth=AUTH, timeout=15) as client:
        resp = await client.get(
            f"{ODATA_URL}/Document_ЗаказКлиента",
            params={
                "$filter": f"Контрагент_Key eq guid'{customer_ref}' and Статус eq '{status}'",
                "$select": "Number,Date,Сумма,ДатаОтгрузки",
                "$top": 50,
            },
        )
    return resp.json().get("value", [])

if __name__ == "__main__":
    mcp.run(transport="stdio")

AI для разработки 1С, зарубежные инструменты

В 2024–2025 родилась отдельная экосистема инструментов для разработчиков 1С на базе зарубежных LLM. Она живёт в контуре разработчика-физлица (см. выше) и не пересекается с прод-эксплуатацией. За полтора года через мои руки прошли Claude Code, Cursor, GitHub Copilot, JetBrains AI Assistant, плюс российские интеграционные обвязки вокруг них.

Claude Code и Cursor

Самый рабочий вариант на 2026 для разработчика 1С это связка Claude Code (CLI Anthropic) или Cursor IDE плюс BSL Language Server от сообщества 1c-syntax. BSL LSP отвечает за разбор кода и навигацию по символам с диагностиками. Claude поверх отвечает за генерацию модулей по описанию, рефакторинг и поиск багов в существующем коде.

Для Claude Code есть готовый плагин 1c-syntax/claude-code-bsl-lsp. Он устанавливается через claude /plugin marketplace add, автоматически скачивает BSL Language Server, поднимает LSP-режим для файлов .bsl и .os. Плагин активный, обновляется в 2026, поддерживает Windows + macOS + Linux.

На сравнительном тесте 7 моделей для разработки в 1С:EDT (Infostart, февраль 2026) в топе оказались Claude Opus 4.5 и Kimi K2.5. Они лучше других понимают структуру конфигурации, дают осмысленные правки в управляемые формы и СКД. GigaChat Pro и GLM-4.7 идут крепкими середняками. YandexGPT 5.1 Pro выдаёт нестабильный результат, иногда корректный BSL, иногда теряет контекст метаданных.

На связке Claude AI + расширение 1C:RSV (37 функций для работы с метаданными и BSL через MCP) опытный разработчик сокращает время на типовых задачах на 50–75%, об этом писал Infostart в марте 2026. Цифра реалистичная для рутины. Это справочники, типовые обработки, печатные формы, отчёты СКД на простом источнике. На сложной бизнес-логике производственного учёта выигрыш меньше, 20–30%.

GitHub Copilot

Copilot в VS Code с BSL-расширением знает синтаксис BSL на уровне «видел в датасете», но галлюцинирует методы. Предлагает несуществующие функции вроде «СортировкаКоллекции» или путает API похожих объектных типов. Полезен для базового автодополнения, для сложных конструкций нужна валидация. На 2026 базовая модель Copilot Business / Enterprise это свежий Codex-вариант линейки GPT-5.x (точную модель смотрите у вендора, OpenAI обновляет её раз в пару месяцев). GitHub анонсировал переход Copilot на оплату по факту использования с июня 2026. Это меняет экономику для команд, проверяйте актуальные условия у вендора.

JetBrains AI Assistant и 1С:EDT

1С:EDT построен на Eclipse, не на IntelliJ Platform. JetBrains AI Assistant интегрирован с IDE семейства IntelliJ (IDEA, PyCharm, WebStorm, GoLand), и для EDT он не подходит напрямую. Развернуть AI-поддержку в EDT можно через сторонний 1С:Напарник (от вендора 1С) или через генерацию BSL во внешнем Claude Code с последующим вставлением в EDT. Прямого IntelliJ-варианта нет.

Aider, Continue.dev, локальные модели

Aider это CLI-помощник на Python, работает с Claude / GPT / локальными моделями через Ollama. Continue.dev это open-source плагин в VS Code / JetBrains с поддержкой локальных моделей. Обе пары умеют работать с .bsl-файлами, но без специального BSL LSP качество понимания контекста ниже, чем у связки Claude Code + BSL Language Server.

Инструменты AI-разработки 1С на середину 2026. Цены и условия меняются, проверяйте актуальное у вендора
Инструмент	Что умеет на BSL	Правовой режим	Стоимость
Claude Code + BSL LSP	Генерация модулей, рефакторинг, поиск багов	Контур разработчика (VPN или зарубежное юр.лицо)	Claude Pro $20/мес или API per token
Cursor IDE + 1C:RSV / MCP	Полный цикл с pre-prompted метаданными	То же	$20/мес Pro, $40 Business
GitHub Copilot + BSL extension	Autocomplete и комментарии, слабо на запросах	Контур разработчика	$10–39/мес. Оплата по факту с июня 2026
JetBrains AI Assistant	Не подходит для EDT (Eclipse-based)	—	—
Aider / Continue.dev + Ollama	Локально, ограниченная BSL-точность	Любой контур (локальная модель)	Бесплатно, но нужен GPU
1С:Напарник (вендорский)	EDT 2023.3.6+, чат, агент, autocomplete	Контур разработчика РФ	Бесплатно для подписчиков ИТС до 1 окт. 2026

Российские встроенные AI-помощники в 1С

Параллельно с зарубежной экосистемой в 2024–2026 фирма «1С» и сообщество запустили российские AI-помощники для разработки и эксплуатации. Они работают в контуре прод-юр.лица в РФ. Без VPN, с закрывающими документами, под надзором 152-ФЗ.

1С:Напарник, EDT-ассистент от вендора

1С:Напарник (code.1c.ai) это встроенный AI-помощник для EDT, выпущенный фирмой «1С». Работает в 1С:EDT 2023.3.6 и выше. Поддерживает чат, автодополнение, агентный режим для сложных задач, генерацию комментариев к процедурам и автоматическое исправление ошибок. Бесплатно для подписчиков ИТС до 1 октября 2026.

Конкретные используемые модели на странице продукта не раскрываются (только контакт ailab@1c.ru). На практике это GigaChat или дообученная модель «1С». Качество на BSL заметно лучше базового GigaChat Pro, ведь модель видела корпус типовых конфигураций и БСП.

Mini AI 1C, open-source для Конфигуратора

Mini AI 1C (hawkxtreme/mini-ai-1c, версия 1.2.7 на май 2026) это десктопный ассистент на Tauri 2 + React 19 + Rust. Работает рядом с открытым Конфигуратором. Захватывает код модуля через Win32 API + UIAutomation, отправляет в LLM, вставляет правки обратно. Поддерживает OpenAI, Claude, Gemini, 1С:Напарник, DeepSeek, Ollama Cloud, плюс встроенный BSL Language Server и MCP-серверы (1С:Reference, 1С:Metadata, 1С:Search Configuration).

Лицензия Attribution Non-Commercial. Для коммерческого использования нужна отдельная договорённость с автором. Платформа это Windows (Linux/macOS экспериментально).

GigaChat в 1С:ERP, назначения платежей

Сбер интегрировал GigaChat с 1С:ERP для обработки банковских выписок. Сервис получает текст назначения платежа, извлекает номер счёта и дату, сопоставляет с базой 1С. Так закрывается одна из самых рутинных задач бухгалтера. Решение поставляется как типовое расширение, активируется через ИТС-портал.

Ася в 1С:Документообороте

В 1С:ДО 3.0 КОРП встроен чат-бот «Ася». Может работать в гибридном режиме. Типовые запросы обрабатывает локально, для сложных подключается к GigaChat через API Сбера. Достаёт данные из 1С (статус документа, маршрут согласования, поручения сотрудника), отправляет в GigaChat для генерации ответа на естественном языке.

ИИкона, универсальный коннектор

ИИкона это расширение для УТ / БП / ERP, подключающее одним API сразу несколько моделей. Это GPT, Claude, Gemini, DeepSeek, YandexGPT, GigaChat. Удобно для команд, которые хотят переключать модель по задаче. Классификацию вешают на дешёвую Lite, RAG на флагман. С учётом санкций GPT и Claude через ИИкону из РФ работают только при наличии прокси, что выводит решение в серую зону для прод-юр.лица.

Что НЕ работает (на 2026)

1. AI как полная замена 1С-программиста

Генерация BSL у топ-моделей (Claude Opus 4.5, Kimi K2.5) заметно подросла к 2026 году по сравнению с 2024-м. Но это по-прежнему ассистент, не самостоятельный разработчик. GigaChat и YandexGPT знают синтаксис BSL примерно на уровне «видел типовые конфигурации». Возьмите сложные конструкции. Это запросы на СКД с динамическим источником, бизнес-процессы с подбизнес-процессами, работа с регистрами накопления через виртуальные таблицы. На них даже Claude выдаёт код с галлюцинированными именами методов. Без живого разработчика на ревью прод-кода ставить нельзя.

2. AI для автозакрытия месяца в бухгалтерии

Закрытие месяца это серия регламентных операций с возможностью ошибок (неправильная очерёдность документов, незакрытый производственный заказ, расхождение в курсе валют). AI на 2026 умеет помочь интерпретировать ошибки, но не самостоятельно провести закрытие. Бухгалтер всё равно нужен. Меня тут пугают вендоры обещаниями «automatic month close». На проде это не работает.

3. Прогноз продаж через LLM

Статистические модели (Prophet, ARIMA, Holt-Winters) дают точность лучше, чем LLM на time-series. Это разные классы задач. LLM хорошо понимает контекст и язык, а сезонность и тренды живут в специализированной математике. Если вам обещают «AI-прогноз продаж», спросите, какая там реально математика. Скорее всего это Prophet под капотом, а LLM лишь обёртка для UX.

4. Полностью автономные AI-агенты в проде

На 2026 нет ни одного AI-агента в коммерческом проде, который бы без человека-контролёра выполнял критичные операции вроде отгрузки или платежа. И не появится в ближайшие пару лет. Любой «autonomous agent» в маркетинговых материалах это либо ограниченный workflow с заранее прописанными ветками, либо человек-в-петле.

YandexGPT / GigaChat / локальные модели

LLM-модели для прода в РФ, на дату публикации. Контекст дан относительно, точные размеры и цены вендоры меняют, сверяйте на актуальной странице моделей у Yandex Cloud и Сбера
Модель	Контекст	Цена	Для каких задач
YandexGPT 5 Lite	Короткий	Самая дешёвая	Классификация, простые ответы
YandexGPT 5 Pro	Длинный, reasoning	Дорогая	RAG, агенты, длинный контекст
GigaChat 2 Lite	Длинный	Дешёвая	Классификация
GigaChat 2 Pro	Длинный	Средняя	Чат-боты, генерация
GigaChat 2 Max	Длинный	Дорогая	Reasoning, длинные документы
Qwen 2.5 72B (локально)	Длинный	Стоимость GPU NVIDIA L40	Когда нельзя отправлять данные наружу
Llama 3.x 70B (локально)	Длинный	Стоимость GPU	Англоязычные задачи, тонкая настройка

Как я выбираю

Решающие факторы по моему опыту:

Данные критичной чувствительности (договоры, ПДн, коммерческая тайна). Тут только локальная модель. Qwen 2.5 72B на NVIDIA L40 даёт качество, близкое к GigaChat 2 Pro.
Простая классификация на массиве. Беру YandexGPT Lite или GigaChat 2 Lite. Дёшево, быстро, точности хватает.
RAG над длинными документами (договоры, методички ФСБУ). Тут YandexGPT 5 Pro или GigaChat 2 Max. Reasoning + длинный контекст важнее цены.
Голосовой агент. Беру YandexGPT 5 Pro (быстрая модель + reasoning + хороший SpeechKit рядом).

Стек интеграции AI с 1С

Набор, к которому я свожу интеграцию AI с 1С:

FastAPI. Python-сервис между LLM и 1С. Обрабатывает request/response, делает retry, ведёт логи, хранит idempotency-key для защиты от дублей.
1С HTTP-сервисы. Экспортируют операции «создать обращение», «найти контрагента по ИНН», «получить остатки по складу». Доступ через basic auth + rate limiting на nginx-уровне.
OData 1С. Для read-only запросов к справочникам и документам. Удобно для RAG-индексации и ассистентских кейсов.
pgvector. Векторное хранилище. Держу его в той же СУБД, что и под 1С (Postgres Pro), отдельной базой.
Prometheus + Grafana. Метрики по запросам к LLM, latency, fail rate, стоимость токенов.
OpenTelemetry. Трассировка end-to-end (письмо → классификация → 1С → менеджер). Без неё на production не отладить.

Зачем читал

Если думаете о пилоте AI на базе 1С, запишитесь на первый разговор через форму контакта. За 30 минут оценю реалистичность вашего сценария, окупаемость, риски и стек, который вам подойдёт. Без обязательств.

Смежные записи. Про инфраструктуру 1С на 2026 (PostgreSQL, Linux, мониторинг) рассказываю в записи про 1С и инфраструктуру 2025–2026. Про релизы конфигураций УТ/ERP/БП рассказываю в записи про новое в 1С на 2026. Полностью выдуманный кейс миграции с AI-классификатором разбираю в кейсе УТ 10.3 → УТ 11.5 + AI.

Первый разговор

Я работаю с этим напрямую — ознакомительный звонок 30 минут

Расскажете ситуацию — отвечу за 4 часа в рабочее время. Звонок бесплатный, без обязательств. Если задача не моя — порекомендую коллег, у которых она хорошо ляжет.

Ознакомительный звонок 30 минут Следующая статья — 1С · методология