Автоматизация техподдержки и эксплуатации ИТ

AI Service Desk. Техподдержку, мониторинг и заявки закрывают ИИ-агенты под контролем человека

Ставлю техническую поддержку и эксплуатацию вашего ИТ на автоматизацию. Сбой замечен, тикет создан, агент устранил. Запрос пользователя разобран и выполнен. Риск-действия идут только с вашим подтверждением.

Разобрать эксплуатацию за 30 минут ИТ уже горит

Зачем это нужно

Эксплуатация съедает время, людей и нервы

Мониторинг у вас, скорее всего, уже стоит. А вот реакции на него нет. Графики краснеют ночью, письма от системы оседают в почте, первым о сбое сообщает раздражённый пользователь. Заявки висят в очереди, потому что свободного инженера под рукой не оказалось.

Своя дежурная смена закрывает эту дыру дорого. Фонд оплаты, ночные дежурства, выгорание, текучка. Один человек ушёл в отпуск, и линия поддержки просела. Классический аутсорс берёт деньги за часы и реагирует медленно, потому что мотив подрядчика обратный вашему.

Я закрываю эту работу иначе. Рутину техподдержки и мониторинга берут на себя ИИ-агенты. Они не спят, не уходят на больничный и берут тикет в момент его появления. Решения с риском остаются за человеком, который отвечает головой.

Как это работает

Два потока работы, оба знакомы по ITIL

После подключения система живёт под присмотром агентов. Работа делится на два понятных потока. Первый ловит сбои. Второй обрабатывает запросы людей. Рутину в обоих закрывают агенты, риск-решения остаются за мной.

Сбой → тикет → анализ → устранение

Мониторинг ловит сбой и заводит тикет с трассировкой и контекстом. Агент читает трассировку, находит причину, проверяет гипотезу на тестовом стенде. Обратимое чинит сам и пишет отчёт о сделанном. Необратимое или связанное с деньгами останавливает и кладёт мне на подтверждение.

Запрос → анализ → выполнение

Пользователь пишет, что ему нужно. Агент разбирает запрос и выполняет его в границах безопасного. Типовая выдача данных, перезапуск зависшего процесса, чистка кэша уходят сразу. Всё, что выходит за рамки, поднимается ко мне.

Оба потока упираются в один гейт. Любое риск-действие — необратимое, деньги, схема прода — проходит через подтверждение человека. Рутина уходит агенту, контроль остаётся за мной.

Без магии

Это ITIL, а не магия

Здесь нет фокусов и нет «волшебного ИИ, который всё решит сам». Под капотом две узнаваемые практики из ITIL. Управление инцидентами отвечает за поиск и устранение сбоев. Исполнение запросов отвечает за выполнение того, что просят пользователи. Эти процессы десятилетиями работают в зрелых ИТ-командах.

Новизна ровно одна. Рутинную часть обоих процессов выполняют агенты, а не дежурная смена людей. Сами процессы, приоритеты и правила эскалации остаются прозрачными и привычными любому, кто работал по ITIL.

Подробный разбор метода — в посте про ITIL на 50–500 человек.

Что автоматизируется

Что переходит с рук на агента

Пять направлений рутины, которые я снимаю с ваших людей. Слева — как обычно делают руками. Справа — как это работает через агента.

Направление	Было руками	Стало через агента
Мониторинг и алертинг	Инженер смотрит графики, ловит письма от системы, реагирует, когда заметил	Агент дежурит круглосуточно, заводит тикет в момент сбоя, сразу берёт его в работу
Типовые инциденты	Зависший процесс, переполненный диск, упавший сервис ждут свободного человека	Агент чинит обратимое сам по известному сценарию и пишет отчёт
Рутинные заявки	Выдать доступ, поднять отчёт, перезапустить задачу. Очередь растёт, пока кто-то не освободится	Агент разбирает запрос и выполняет в границах безопасного без ожидания
CI/CD-пайплайны	Сборка, проверки, выкатка собираются и чинятся вручную, релиз тормозит	Сборка проходит проверки, после зелёного результата изменения уходят на прод с точкой отката
Плановые операции	Проверка бэкапов, обновления по регламенту делаются по остаточному принципу	Агент выполняет регламент по расписанию и сигналит об отклонениях

Граница и контроль

Где проходит граница и кто держит стоп-кран

Это не оговорка мелким шрифтом, а основа доверия к модели. Граница автономии агента жёсткая и описана заранее. Серьёзный клиент покупает именно её, а не обещание «ИИ сам разберётся».

Обратимое и безопасное — без меня

Перезапуск зависшего процесса. Чистка кэша. Откат кода на предыдущий рабочий релиз, когда между версиями не менялась схема базы. Ответ на типовой запрос данных. Любое действие, которое легко отыграть назад.

Необратимое, деньги, схема прода — через меня

Миграция схемы базы на проде. Любая операция с деньгами. Удаление данных. Смена секретов прода. Нестандартный случай вне известных сценариев. Такие действия агент готовит и кладёт мне на подтверждение с планом и точкой отката. Решение принимаю я.

Под каждым действием агента лежит откат к рабочему состоянию. Каждый шаг пишется в журнал, кто и что сделал видно поминутно. За инцидент на проде отвечает человек, то есть я, а не агент. Когда вам продают «ИИ всё сделает сам без присмотра» — это и есть красный флаг.

Экономика

Что это даёт в деньгах

Сравниваю честно с двумя привычными вариантами. Со своей дежурной сменой и с классическим аутсорсом часов.

Штатная эксплуатация

За что платите: Фонд оплаты, налоги, оборудование, ночные дежурства
Скорость реакции: Зависит от свободного человека и смены
Доступность: Проседает в отпуска, болезни, текучку
Кто отвечает за прод: Дежурный инженер

Аутсорс по часам

За что платите: Часы подрядчика по тарифу
Скорость реакции: Оплата за часы не мотивирует закрывать быстро
Доступность: По регламенту договора, чаще в рабочие часы
Кто отвечает за прод: Размыто между сторонами

AI Service Desk

За что платите: Подключение плюс абонентское ведение по объёму
Скорость реакции: Тикет берётся в момент появления
Доступность: Круглосуточно, без человеческого фактора
Кто отвечает за прод: Один ответственный эксперт, это я

Вы платите за результат одному ответственному эксперту с понятной зоной ответственности вместо содержания дежурной линии. Инциденты и заявки закрываются быстрее, потому что агент берёт тикет сразу. Против содержания дежурной смены 24/7 разница в расходах кратная. Точную цифру считаю под ваш объём на разборе.

Для кого

Кому подходит, а кому нет

Кому подходит

Компании, у которых есть боевые системы и прод, который нельзя ронять
Нет своей дежурной смены или она дорогая
Заявки и инциденты сегодня ждут свободного человека

Кому НЕ подходит

Если систем одна-две и сбой не бьёт по деньгам — хватит обычного мониторинга с уведомлениями
Если требуется штатная дежурная смена на месте по регуляторике — это другой формат

Форматы

Как начать и в каком формате вести

Два шага. Сначала разовое подключение и настройка. Потом абонентское ведение по объёму. Можно остановиться после первого шага, если хотите сначала получить рабочий мониторинг и тикеты, а ведение взять позже.

Шаг 1

Подключение и настройка (разовый старт)

Ставлю мониторинг и трассировку ошибок, описываю сценарии типовых инцидентов, настраиваю правила эскалации, подключаю агентов к вашим процессам и доступам по минимально необходимому принципу. На выходе — работающий контур и понятная граница автономии под вашу инфраструктуру.

Цена: по результату разбора

Шаг 2

Абонентское ведение Service Desk (по объёму)

Веду мониторинг, инциденты и запросы на постоянной основе. Объём считается по нагрузке: число систем под присмотром, поток тикетов и заявок, ритм плановых операций. Ежемесячный отчёт о закрытых инцидентах и заявках. Риск-действия согласую отдельно по каждому.

Цена: по результату разбора

Точную стоимость называю после разбора. Она зависит от объёма систем и потока обращений, гадать вслепую не берусь.

Доказательство

Это уже работает на проде

Я не рассказываю про модель в теории. Я веду по ней боевую систему с живыми пользователями и реальными деньгами в обороте. Мониторинг ошибок через Hawk, конвейер поставки с автоматическими проверками, агенты на проде в границах безопасного. Четыре реальных факапа с этого проекта я разобрал в большом материале честно, с уроком из каждого.

Клиента не называю под NDA. Метод, стек и принципы описаны полностью.

Читать разбор: «Production-CRM в одиночку, командой ИИ-агентов»

Ещё один AI-проект в проде — голосовой AI-менеджер на входящих звонках.

Частые вопросы

Что обычно спрашивают про AI Service Desk

Агент сам полезет на мой прод?

Только в границах обратимого и безопасного. Перезапуск процесса, чистка кэша, откат кода на рабочий релиз, типовая выдача данных идут без меня. Миграцию схемы, операции с деньгами, удаление данных и смену секретов агент сам не трогает. Он готовит такое действие и ждёт моего подтверждения с планом и точкой отката.

Кто отвечает за инцидент на проде?

Человек. Я. Агент делает работу, но право на риск-действие и ответственность за последствия остаются за мной. Это зашито в саму модель, а не подразумевается на словах.

Что с 152-ФЗ и доступами?

Персональные данные обрабатываются на вашей инфраструктуре под вашим контролем. Доступы агентам выдаются по минимально необходимому принципу, как живому сотруднику. Все действия пишутся в журнал. Риск-операции с данными требуют подтверждения. Конкретику под ваши требования разбираю отдельно перед стартом.

Чем это отличается от штатного DevOps?

Штатный инженер — это фонд оплаты, ночные дежурства и провал в отпуск или болезнь. Здесь рутину держат агенты круглосуточно, а инженерную планку и ответственность держу я один. Вы платите за результат и зону ответственности, а не за содержание дежурной линии. Скорость реакции выше, потому что агент берёт тикет сразу.

А если агент ошибётся?

Под каждым его действием лежит откат к рабочему состоянию, а необратимое он без меня не делает. Поэтому худший реалистичный случай — короткий откат на предыдущий рабочий релиз, а не катастрофа. Каждый шаг в журнале, причину видно сразу. На боевом проекте, который разобран в блоке «Доказательство», четыре сбоя закрылись именно так. В процессе был человек с правом стоп-крана.

Сколько стоит против штата?

Подключение плюс абонентское ведение по объёму против фонда оплаты дежурной смены. Разница кратная, в разы. Точная цифра зависит от числа систем под присмотром и потока обращений, я считаю её на разборе под ваш случай.

Разбор за 30 минут

Разберём вашу эксплуатацию за 30 минут

Покажу, что из мониторинга, инцидентов и заявок можно отдать агентам, а что оставить людям. Без обязательств. Если задача не моя, скажу честно и порекомендую коллег.

Отвечу в рабочее время, Пн–Пт 09:00–19:00 MSK.

Срочный вход

ИТ уже горит? Звоните сейчас

Если у вас прямо сейчас лежит прод, теряются данные или встал релиз, не ждите письма. Наберите напрямую, разберёмся по горячим следам.

Телефон и Telegram открываются по клику. Контакты не светятся в коде страницы, это защита от скраперов.