«А почему не ChatGPT?»
Каждый второй владелец B2B-бизнеса в 2026-м спрашивает меня: «А почему мы не можем просто прикрутить ChatGPT?» Можем. В восьми случаях из десяти этот проект не окупится, и проблема не в ChatGPT, а в неправильно поставленной задаче. Я разбираю шесть различий, которые отделяют рабочий AI от витрины с эффектом.
Запись для владельца или CEO 50–500 человек, который между двумя вариантами или думает «нам бы что-то с AI». Тут нет ни одного «но» в пользу моих услуг. Если по матрице выходит, что вам сейчас ни голос, ни чат не нужен, я скажу честно.
Различие 1. Канал решения
Голосовой звонок означает, что клиент уже принял решение. Он набирает номер с конкретной задачей. Купить, проверить статус, пожаловаться. AI-менеджер на голосе закрывает запрос здесь и сейчас. Если запрос закрылся положительно, у клиента отгрузка через сутки. Канал работает на этап транзакции.
Чат на сайте означает, что клиент только думает. Он бродит по каталогу, сравнивает с конкурентом, открыл диалог в надежде получить три цифры быстрее, чем по форме обратной связи. Чат закрывает лидген и первичную квалификацию. До транзакции от чата ещё две–три коммуникации, обычно голосом или через CRM-менеджера.
Я видел проекты, где владелец пытался закрыть транзакцию через чат, отгружать заказы на 500 тысяч рублей по переписке в виджете на сайте. Это работает в нишах ритейла с типовым товаром (одежда, косметика). В B2B со сложным ценообразованием так не выйдет.
Различие 2. Доступ к бэкенду
AI-менеджер на 1С с интеграцией через FastAPI-шлюз это инструмент, который проверяет остаток на складе, цену по сегменту контрагента, кредитный лимит, срок отгрузки. Каждая цифра вытащена из учётной системы, не сгенерирована. Если в 1С указано 320 метров, клиент услышит 320 метров. Если 0, клиент услышит «на складе нет, ближайшее поступление в четверг».
ChatGPT-бот на сайте без интеграции это LLM, который красиво говорит. На вопрос «есть ли у вас труба 159 мм?» он отвечает развёрнуто и правдоподобно. Реальность остатка он не знает. Это поведение терпимо для FAQ («сколько лет вы на рынке», «работаете ли с НДС»), но катастрофично для запроса остатка.
ChatGPT с интеграцией в 1С через function calling возможен технически. Но я не рекомендую его клиентам в РФ в 2026 году по простой причине. Это санкционный риск отзыва API. OpenAI закрыла доступ из России сама ещё в 2024 году в рамках своего санкционного комплаенса. Блокировка по IP, по платежам, по верификации. На прод-проект, где AI-менеджер закрывает 70% входящих, нельзя ставить инфраструктуру, которая может отвалиться по санкционному комплаенсу провайдера.
Поэтому разделяю два случая. На собственном инференсе беру открытые веса. Это Qwen3 (актуальная открытая линейка Qwen, Apache 2.0), YandexGPT-5-Lite, T-Pro и T-Lite от Т-Технологий. Последние дообучены на русском и тоже лежат открыто на HuggingFace. На РФ-облаке, когда свой инференс не оправдан по нагрузке, беру YandexGPT 5 или GigaChat через их API в Yandex Cloud и Сбере. Полные облачные модели у себя в общем случае не поднять, а открытые веса поднять можно.
Различие 3. Цена ошибки
На голосе ошибка дороже. AI назвал клиенту 320 метров, клиент оформил заявку, через сутки отгрузка отказывает. Реального остатка нет. Клиент звонит в гневе, репутация получает удар, менеджер потратит полчаса на разбор и компенсацию. В B2B такие инциденты помнят месяцами.
В чате ошибка проще исправляется. Клиент прочитал неправильный ответ, удивился, перепросил живого менеджера, и менеджер поправил. Чат не финализирует транзакцию, значит не несёт репутационных последствий уровня сорванной отгрузки.
Это различие диктует требования к интеграции и верификации. На голосе обязательны три вещи. Проверка остатка с учётом резервов, повторная проверка цены перед финализацией заявки, idempotency-key на каждом вызове 1С для защиты от двойного списания. На чате это необязательно, чат может работать на кешированных данных с TTL 15 минут.
Различие 4. Латентность и темп
На голосе допустимая пауза доходит до 7 секунд при медианных 5. Клиент в трубке слышит wait-marker «минутку, проверяю по складу» и спокойно ждёт. Про латентность голосового пайплайна у меня есть отдельная запись с разбивкой по узлам, там пять стрелок и хронометраж на каждой.
В чате клиент ждёт максимум 1–2 секунды на первый символ ответа. После двух секунд он переключается на вкладку с конкурентом. Значит, чат не может ходить в 1С на каждое сообщение. Чат должен работать на индексе (pgvector RAG по FAQ, статусам типовых товаров), обновляемом раз в 15 минут. Глубокие обращения в 1С идут только при явной квалификации клиента (зарегистрирован, вошёл в личный кабинет, готов к расчёту).
На голосе LLM может потратить 1.5–2.5 секунды на planning step. В чате этот шаг должен быть либо обрезан, либо вынесен в фоновый async-вызов с предварительным ответом из RAG. Архитектурно это два разных пайплайна, не один и тот же с разной обёрткой.
Различие 5. Кого замещаем
Голосовой AI-менеджер на B2B-входящих замещает на типовых сценариях 2.5FTEзамещение первой линии операторов. Цифру 3–5, которую часто рисуют интеграторы, я считаю маркетинговой. На реальных проектах редко получается больше 2.5. Если получается, то обычно за счёт того, что предыдущая команда была сильно избыточна.
Чат-бот на сайте замещает 1–1.5 FTE менеджера первичных консультаций. Здесь экономика тоньше. Менеджер первичной квалификации в регионе стоит 50–70 тыс./мес, против 75 тыс./мес у оператора колл-центра. Меньше замещение, меньше окупаемость, дольше срок выхода в плюс.
Поэтому я считаю окупаемость по двум сценариям отдельно. Голос окупается за 4–6месголос при нагрузке 800–1500 звонков в неделю, чат за 8–14месчат при 2000–5000 диалогов в месяц. Если у клиента ниже этих порогов, не окупится ничего, и я предлагаю сначала набрать поток, потом говорить про AI.
Различие 6. Стоимость владения
Голос на собственной инфраструктуре дороже. Чат на провайдерском API дешевле, но привязывает к провайдеру. Провайдера беру только российского, по той же причине санкционной устойчивости, что и для голоса. Дешёвый API, который завтра отвалится по комплаенсу, в TCO считать нельзя.
| Статья | Голос на 1С | Чат на сайте |
|---|---|---|
| Инфраструктура (GPU L4, серверы, лицензии) | 70–110 тыс./мес | 0–10 тыс./мес (если работаем на API) |
| Поддержка DevOps | 20–40 тыс./мес (0.3–0.5 FTE) | 5–15 тыс./мес (0.1 FTE) |
| Платный API LLM (если облако) | 0–30 тыс./мес (резерв) | 5–15 тыс./мес |
| Итого TCO | 80–150 тыс./мес | 10–40 тыс./мес |
| Внедрение (разово) | 3.6–4.8 млн | 0.7–1.4 млн |
На стороне внедрения разница в 5 раз. На стороне TCO в 4 раза. Это объясняется тем, что голос требует GPU под STT и под LLM-инференс, идущие параллельно по каждому звонку. Чат на API ходит к провайдеру и за инференс платит поминутно.
Соблазн посадить голосовой AI тоже на провайдерский API (Yandex SpeechKit + GigaChat) есть. На одном пилоте я так пробовал. P95 уходил 10–12секP95 на провайдере латентности. Провайдеры не дают гарантий по времени отклика на каждый запрос. Перешёл на собственный inference, латентность упала примерно на четверть–треть. С тех пор советую клиентам собственный inference для голоса от 500 звонков в день.
Матрица выбора
Я свёл шесть различий в одну таблицу. По ней вы можете за 5 минут понять, какой канал стоит рассматривать.
Матрица для B2B 50–500 человек, май 2026.
›Этап клиента
- Голос на 1С
- Транзакция
- Чат на сайте
- Лидген, FAQ
- Никакого AI
- Любой
›Объём обращений
- Голос на 1С
- ≥ 800 звонков/нед
- Чат на сайте
- ≥ 2000 чатов/мес
- Никакого AI
- ниже порогов
›Цена ошибки
- Голос на 1С
- Высокая (отгрузка)
- Чат на сайте
- Средняя (повторный вопрос)
- Никакого AI
- —
›Допустимая латентность
- Голос на 1С
- 5–7 сек
- Чат на сайте
- 1–2 сек
- Никакого AI
- —
›Замещение
- Голос на 1С
- 2.5 FTE
- Чат на сайте
- 1–1.5 FTE
- Никакого AI
- —
›TCO в месяц
- Голос на 1С
- 80–150 тыс.
- Чат на сайте
- 10–40 тыс.
- Никакого AI
- 0
›Окупаемость
- Голос на 1С
- 4–6 мес
- Чат на сайте
- 8–14 мес
- Никакого AI
- —
›Внедрение
- Голос на 1С
- 3.6–4.8 млн
- Чат на сайте
- 0.7–1.4 млн
- Никакого AI
- 0
Когда уместен голос
Голосовой AI-менеджер окупается на B2B с тремя признаками одновременно. Входящий поток от 800 звонков в неделю, типовые сценарии закрывают 60% разговоров (остаток, цена, срок), интеграция с 1С возможна через HTTP-сервисы (1С 8.3 ПРОФ или КОРП с настроенным API-доступом).
Типичные отрасли, где сценарий складывается. Оптовая торговля промышленным товаром, поставщики строительных материалов, дистрибуция расходников, сервисные центры с входящими по статусу заявок. Здесь B2B-клиент звонит часто, повторно, с одинаковыми вопросами. Это идеальный материал для AI.
Не работает голос в нишах с уникальными сделками. Это тендерный проектный бизнес, B2B-консалтинг, дорогие машины и оборудование с длинным циклом сделки. Здесь каждый звонок отдельный кейс, типизация невозможна, AI генерирует больше шума, чем пользы.
Когда уместен чат
Чат-бот закрывает другой сегмент задач. Главный сценарий это лидген на сайте с массовым трафиком. Е-коммерс, инфобизнес, услуги с типовой первичной квалификацией. Здесь чат снимает с менеджеров обращения «когда у вас доставка», «есть ли скидка», «работаете ли с моим городом». До 60–70% входящих вопросов сайта снимает не менеджер, а бот.
Второй сценарий это FAQ для существующих клиентов. Чат на странице поддержки, где база собрана из статусов заявок, расписания сервисов, инструкций по личному кабинету. Снимает 30–50% поддержки первой линии.
Третий сценарий это первичная квалификация B2B-лида перед передачей менеджеру. Бот задаёт 4–5 вопросов, собирает компанию, контакт, бюджет, срок, передаёт менеджеру с готовой карточкой. Менеджер не тратит первые 10 минут звонка на формальности.
Чат не работает на запросах остатка в B2B со сложным ценообразованием и не работает на длинных консультативных продажах. Я в обоих сценариях возвращаюсь к голосу или к живому менеджеру.
Когда никакого AI
Если у вас меньше 100 обращений в неделю на канал, никакой AI не окупится. Внедрение голоса 3.6–4.8 млн, чат 0.7–1.4 млн, ниже порога экономии вы будете кормить инфраструктуру дороже, чем замещаете человека.
Если у вас бизнес с уникальными сделками (тендерный проектный, дорогое оборудование, консалтинг), типизация сценариев невозможна, AI станет помехой. Здесь работает живой менеджер и хорошо сделанный CRM с knowledge-base, без всякого LLM.
Если регуляторное давление выше среднего (банк, медицина, госконтракт), каждое слово AI-менеджера потенциально юридически значимо. Внедрение под такие требования обходится вдвое дороже, окупаемость растёт с 4–6 месяцев до 14–18. Чаще выгоднее обучить операторов лучше, чем ставить AI на телефон.
Зачем читал
Если вы между двумя вариантами или думаете «нам бы что-то с AI», запишитесь на вводный звонок через форму контакта. На нём я задам четыре вопроса по нагрузке и сегменту, и через 30 минут вы получите честный ответ. Что вам подойдёт, что не окупится, что подождёт ещё год.
Если уже понимаете, что у вас голосовой сценарий, посмотрите запись про шесть секунд латентности и почему это правильно. Там разбор по каждой стрелке голосового пайплайна с таймингами из ClickHouse и обоснованием, почему я не сокращаю цепочку за счёт удаления 1С.
Я работаю с этим напрямую — ознакомительный звонок 30 минут
Расскажете ситуацию — отвечу за 4 часа в рабочее время. Звонок бесплатный, без обязательств. Если задача не моя — порекомендую коллег, у которых она хорошо ляжет.