«А почему не ChatGPT?»

Каждый второй владелец B2B-бизнеса в 2026-м спрашивает меня: «А почему мы не можем просто прикрутить ChatGPT?» Можем. В восьми случаях из десяти этот проект не окупится, и проблема не в ChatGPT, а в неправильно поставленной задаче. Я разбираю шесть различий, которые отделяют рабочий AI от витрины с эффектом.

Запись для владельца или CEO 50–500 человек, который между двумя вариантами или думает «нам бы что-то с AI». Тут нет ни одного «но» в пользу моих услуг. Если по матрице выходит, что вам сейчас ни голос, ни чат не нужен, я скажу честно.

Различие 1. Канал решения

Голосовой звонок означает, что клиент уже принял решение. Он набирает номер с конкретной задачей. Купить, проверить статус, пожаловаться. AI-менеджер на голосе закрывает запрос здесь и сейчас. Если запрос закрылся положительно, у клиента отгрузка через сутки. Канал работает на этап транзакции.

Чат на сайте означает, что клиент только думает. Он бродит по каталогу, сравнивает с конкурентом, открыл диалог в надежде получить три цифры быстрее, чем по форме обратной связи. Чат закрывает лидген и первичную квалификацию. До транзакции от чата ещё две–три коммуникации, обычно голосом или через CRM-менеджера.

Я видел проекты, где владелец пытался закрыть транзакцию через чат, отгружать заказы на 500 тысяч рублей по переписке в виджете на сайте. Это работает в нишах ритейла с типовым товаром (одежда, косметика). В B2B со сложным ценообразованием так не выйдет.

Различие 2. Доступ к бэкенду

AI-менеджер на 1С с интеграцией через FastAPI-шлюз это инструмент, который проверяет остаток на складе, цену по сегменту контрагента, кредитный лимит, срок отгрузки. Каждая цифра вытащена из учётной системы, не сгенерирована. Если в 1С указано 320 метров, клиент услышит 320 метров. Если 0, клиент услышит «на складе нет, ближайшее поступление в четверг».

ChatGPT-бот на сайте без интеграции это LLM, который красиво говорит. На вопрос «есть ли у вас труба 159 мм?» он отвечает развёрнуто и правдоподобно. Реальность остатка он не знает. Это поведение терпимо для FAQ («сколько лет вы на рынке», «работаете ли с НДС»), но катастрофично для запроса остатка.

ChatGPT с интеграцией в 1С через function calling возможен технически. Но я не рекомендую его клиентам в РФ в 2026 году по простой причине. Это санкционный риск отзыва API. OpenAI закрыла доступ из России сама ещё в 2024 году в рамках своего санкционного комплаенса. Блокировка по IP, по платежам, по верификации. На прод-проект, где AI-менеджер закрывает 70% входящих, нельзя ставить инфраструктуру, которая может отвалиться по санкционному комплаенсу провайдера.

Поэтому разделяю два случая. На собственном инференсе беру открытые веса. Это Qwen3 (актуальная открытая линейка Qwen, Apache 2.0), YandexGPT-5-Lite, T-Pro и T-Lite от Т-Технологий. Последние дообучены на русском и тоже лежат открыто на HuggingFace. На РФ-облаке, когда свой инференс не оправдан по нагрузке, беру YandexGPT 5 или GigaChat через их API в Yandex Cloud и Сбере. Полные облачные модели у себя в общем случае не поднять, а открытые веса поднять можно.

Различие 3. Цена ошибки

На голосе ошибка дороже. AI назвал клиенту 320 метров, клиент оформил заявку, через сутки отгрузка отказывает. Реального остатка нет. Клиент звонит в гневе, репутация получает удар, менеджер потратит полчаса на разбор и компенсацию. В B2B такие инциденты помнят месяцами.

В чате ошибка проще исправляется. Клиент прочитал неправильный ответ, удивился, перепросил живого менеджера, и менеджер поправил. Чат не финализирует транзакцию, значит не несёт репутационных последствий уровня сорванной отгрузки.

Это различие диктует требования к интеграции и верификации. На голосе обязательны три вещи. Проверка остатка с учётом резервов, повторная проверка цены перед финализацией заявки, idempotency-key на каждом вызове 1С для защиты от двойного списания. На чате это необязательно, чат может работать на кешированных данных с TTL 15 минут.

Различие 4. Латентность и темп

На голосе допустимая пауза доходит до 7 секунд при медианных 5. Клиент в трубке слышит wait-marker «минутку, проверяю по складу» и спокойно ждёт. Про латентность голосового пайплайна у меня есть отдельная запись с разбивкой по узлам, там пять стрелок и хронометраж на каждой.

В чате клиент ждёт максимум 1–2 секунды на первый символ ответа. После двух секунд он переключается на вкладку с конкурентом. Значит, чат не может ходить в 1С на каждое сообщение. Чат должен работать на индексе (pgvector RAG по FAQ, статусам типовых товаров), обновляемом раз в 15 минут. Глубокие обращения в 1С идут только при явной квалификации клиента (зарегистрирован, вошёл в личный кабинет, готов к расчёту).

На голосе LLM может потратить 1.5–2.5 секунды на planning step. В чате этот шаг должен быть либо обрезан, либо вынесен в фоновый async-вызов с предварительным ответом из RAG. Архитектурно это два разных пайплайна, не один и тот же с разной обёрткой.

Различие 5. Кого замещаем

Голосовой AI-менеджер на B2B-входящих замещает на типовых сценариях 2.5FTEзамещение первой линии операторов. Цифру 3–5, которую часто рисуют интеграторы, я считаю маркетинговой. На реальных проектах редко получается больше 2.5. Если получается, то обычно за счёт того, что предыдущая команда была сильно избыточна.

Чат-бот на сайте замещает 1–1.5 FTE менеджера первичных консультаций. Здесь экономика тоньше. Менеджер первичной квалификации в регионе стоит 50–70 тыс./мес, против 75 тыс./мес у оператора колл-центра. Меньше замещение, меньше окупаемость, дольше срок выхода в плюс.

Поэтому я считаю окупаемость по двум сценариям отдельно. Голос окупается за 4–6месголос при нагрузке 800–1500 звонков в неделю, чат за 8–14месчат при 2000–5000 диалогов в месяц. Если у клиента ниже этих порогов, не окупится ничего, и я предлагаю сначала набрать поток, потом говорить про AI.

Различие 6. Стоимость владения

Голос на собственной инфраструктуре дороже. Чат на провайдерском API дешевле, но привязывает к провайдеру. Провайдера беру только российского, по той же причине санкционной устойчивости, что и для голоса. Дешёвый API, который завтра отвалится по комплаенсу, в TCO считать нельзя.

Цены май 2026, проекты по РФ, считаю без НДС.
Статья	Голос на 1С	Чат на сайте
Инфраструктура (GPU L4, серверы, лицензии)	70–110 тыс./мес	0–10 тыс./мес (если работаем на API)
Поддержка DevOps	20–40 тыс./мес (0.3–0.5 FTE)	5–15 тыс./мес (0.1 FTE)
Платный API LLM (если облако)	0–30 тыс./мес (резерв)	5–15 тыс./мес
Итого TCO	80–150 тыс./мес	10–40 тыс./мес
Внедрение (разово)	3.6–4.8 млн	0.7–1.4 млн

На стороне внедрения разница в 5 раз. На стороне TCO в 4 раза. Это объясняется тем, что голос требует GPU под STT и под LLM-инференс, идущие параллельно по каждому звонку. Чат на API ходит к провайдеру и за инференс платит поминутно.

Соблазн посадить голосовой AI тоже на провайдерский API (Yandex SpeechKit + GigaChat) есть. На одном пилоте я так пробовал. P95 уходил 10–12секP95 на провайдере латентности. Провайдеры не дают гарантий по времени отклика на каждый запрос. Перешёл на собственный inference, латентность упала примерно на четверть–треть. С тех пор советую клиентам собственный inference для голоса от 500 звонков в день.

Матрица выбора

Я свёл шесть различий в одну таблицу. По ней вы можете за 5 минут понять, какой канал стоит рассматривать.

Матрица для B2B 50–500 человек, май 2026.
Параметр	Голос на 1С	Чат на сайте	Никакого AI
Этап клиента	Транзакция	Лидген, FAQ	Любой
Объём обращений	≥ 800 звонков/нед	≥ 2000 чатов/мес	ниже порогов
Цена ошибки	Высокая (отгрузка)	Средняя (повторный вопрос)	—
Допустимая латентность	5–7 сек	1–2 сек	—
Замещение	2.5 FTE	1–1.5 FTE	—
TCO в месяц	80–150 тыс.	10–40 тыс.	0
Окупаемость	4–6 мес	8–14 мес	—
Внедрение	3.6–4.8 млн	0.7–1.4 млн	0

Когда уместен голос

Голосовой AI-менеджер окупается на B2B с тремя признаками одновременно. Входящий поток от 800 звонков в неделю, типовые сценарии закрывают 60% разговоров (остаток, цена, срок), интеграция с 1С возможна через HTTP-сервисы (1С 8.3 ПРОФ или КОРП с настроенным API-доступом).

Типичные отрасли, где сценарий складывается. Оптовая торговля промышленным товаром, поставщики строительных материалов, дистрибуция расходников, сервисные центры с входящими по статусу заявок. Здесь B2B-клиент звонит часто, повторно, с одинаковыми вопросами. Это идеальный материал для AI.

Не работает голос в нишах с уникальными сделками. Это тендерный проектный бизнес, B2B-консалтинг, дорогие машины и оборудование с длинным циклом сделки. Здесь каждый звонок отдельный кейс, типизация невозможна, AI генерирует больше шума, чем пользы.

Когда уместен чат

Чат-бот закрывает другой сегмент задач. Главный сценарий это лидген на сайте с массовым трафиком. Е-коммерс, инфобизнес, услуги с типовой первичной квалификацией. Здесь чат снимает с менеджеров обращения «когда у вас доставка», «есть ли скидка», «работаете ли с моим городом». До 60–70% входящих вопросов сайта снимает не менеджер, а бот.

Второй сценарий это FAQ для существующих клиентов. Чат на странице поддержки, где база собрана из статусов заявок, расписания сервисов, инструкций по личному кабинету. Снимает 30–50% поддержки первой линии.

Третий сценарий это первичная квалификация B2B-лида перед передачей менеджеру. Бот задаёт 4–5 вопросов, собирает компанию, контакт, бюджет, срок, передаёт менеджеру с готовой карточкой. Менеджер не тратит первые 10 минут звонка на формальности.

Чат не работает на запросах остатка в B2B со сложным ценообразованием и не работает на длинных консультативных продажах. Я в обоих сценариях возвращаюсь к голосу или к живому менеджеру.

Когда никакого AI

Если у вас меньше 100 обращений в неделю на канал, никакой AI не окупится. Внедрение голоса 3.6–4.8 млн, чат 0.7–1.4 млн, ниже порога экономии вы будете кормить инфраструктуру дороже, чем замещаете человека.

Если у вас бизнес с уникальными сделками (тендерный проектный, дорогое оборудование, консалтинг), типизация сценариев невозможна, AI станет помехой. Здесь работает живой менеджер и хорошо сделанный CRM с knowledge-base, без всякого LLM.

Если регуляторное давление выше среднего (банк, медицина, госконтракт), каждое слово AI-менеджера потенциально юридически значимо. Внедрение под такие требования обходится вдвое дороже, окупаемость растёт с 4–6 месяцев до 14–18. Чаще выгоднее обучить операторов лучше, чем ставить AI на телефон.

Зачем читал

Если вы между двумя вариантами или думаете «нам бы что-то с AI», запишитесь на вводный звонок через форму контакта. На нём я задам четыре вопроса по нагрузке и сегменту, и через 30 минут вы получите честный ответ. Что вам подойдёт, что не окупится, что подождёт ещё год.

Если уже понимаете, что у вас голосовой сценарий, посмотрите запись про шесть секунд латентности и почему это правильно. Там разбор по каждой стрелке голосового пайплайна с таймингами из ClickHouse и обоснованием, почему я не сокращаю цепочку за счёт удаления 1С.

AI-менеджер на 1С против ChatGPT-бота на сайте. 6 различий, которые решают, окупится проект или нет