dkayumov.ru
Все услуги
AI-эксплуатация ИТ под ключ

AI Service Desk: мониторинг и заявки закрывают агенты, под контролем человека

Ставлю эксплуатацию вашего ИТ на автоматизацию. Сбой замечен, тикет создан, агент устранил. Запрос пользователя разобран и выполнен. Риск-действия идут только с вашим подтверждением.

Зачем это нужно

Эксплуатация съедает время, людей и нервы

Мониторинг у вас, скорее всего, уже стоит. А вот реакции на него нет. Графики краснеют ночью, письма от системы оседают в почте, первым о сбое сообщает раздражённый пользователь. Заявки висят в очереди, потому что свободного инженера под рукой не оказалось.

Своя дежурная смена закрывает эту дыру дорого. Фонд оплаты, ночные дежурства, выгорание, текучка. Один человек ушёл в отпуск, и линия поддержки просела. Классический аутсорс берёт деньги за часы и реагирует медленно, потому что мотив подрядчика обратный вашему.

Я закрываю эту работу иначе. Рутину мониторинга и заявок берут на себя ИИ-агенты. Они не спят, не уходят на больничный и берут тикет в момент его появления. Решения с риском остаются за человеком, который отвечает головой.

Как это работает

Два потока работы, оба знакомы по ITIL

После подключения система живёт под присмотром агентов. Работа делится на два понятных потока. Первый ловит сбои. Второй обрабатывает запросы людей. Рутину в обоих закрывают агенты, риск-решения остаются за мной.

Сбой → тикет → анализ → устранение

Мониторинг ловит сбой и заводит тикет с трассировкой и контекстом. Агент читает трассировку, находит причину, проверяет гипотезу на тестовом стенде. Обратимое чинит сам и пишет отчёт о сделанном. Необратимое или связанное с деньгами останавливает и кладёт мне на подтверждение.

Запрос → анализ → выполнение

Пользователь пишет, что ему нужно. Агент разбирает запрос и выполняет его в границах безопасного. Типовая выдача данных, перезапуск зависшего процесса, чистка кэша уходят сразу. Всё, что выходит за рамки, поднимается ко мне.

Оба потока упираются в один гейт. Любое риск-действие — необратимое, деньги, схема прода — проходит через подтверждение человека. Рутина уходит агенту, контроль остаётся за мной.

Без магии

Это ITIL, а не магия

Здесь нет фокусов и нет «волшебного ИИ, который всё решит сам». Под капотом две узнаваемые практики из ITIL. Управление инцидентами отвечает за поиск и устранение сбоев. Исполнение запросов отвечает за выполнение того, что просят пользователи. Эти процессы десятилетиями работают в зрелых ИТ-командах.

Новизна ровно одна. Рутинную часть обоих процессов выполняют агенты, а не дежурная смена людей. Сами процессы, приоритеты и правила эскалации остаются прозрачными и привычными любому, кто работал по ITIL.

Подробный разбор метода — в посте про ITIL на 50–500 человек.

Что автоматизируется

Что переходит с рук на агента

Пять направлений рутины, которые я снимаю с ваших людей. Слева — как обычно делают руками. Справа — как это работает через агента.

НаправлениеБыло рукамиСтало через агента
Мониторинг и алертингИнженер смотрит графики, ловит письма от системы, реагирует, когда заметилАгент дежурит круглосуточно, заводит тикет в момент сбоя, сразу берёт его в работу
Типовые инцидентыЗависший процесс, переполненный диск, упавший сервис ждут свободного человекаАгент чинит обратимое сам по известному сценарию и пишет отчёт
Рутинные заявкиВыдать доступ, поднять отчёт, перезапустить задачу. Очередь растёт, пока кто-то не освободитсяАгент разбирает запрос и выполняет в границах безопасного без ожидания
CI/CD-пайплайныСборка, проверки, выкатка собираются и чинятся вручную, релиз тормозитАгент гоняет полный набор проверок, на зелёном — мердж и деплой с точкой отката
Плановые операцииПроверка бэкапов, обновления по регламенту делаются по остаточному принципуАгент выполняет регламент по расписанию и сигналит об отклонениях
Граница и контроль

Где проходит граница и кто держит стоп-кран

Это не оговорка мелким шрифтом, а основа доверия к модели. Граница автономии агента жёсткая и описана заранее. Серьёзный клиент покупает именно её, а не обещание «ИИ сам разберётся».

Обратимое и безопасное — без меня

Перезапуск зависшего процесса. Чистка кэша. Откат кода на предыдущий рабочий релиз, когда между версиями не менялась схема базы. Ответ на типовой запрос данных. Любое действие, которое легко отыграть назад.

Необратимое, деньги, схема прода — через меня

Миграция схемы базы на проде. Любая операция с деньгами. Удаление данных. Смена секретов прода. Нестандартный случай вне известных сценариев. Такие действия агент готовит и кладёт мне на подтверждение с планом и точкой отката. Решение принимаю я.

Под каждым действием агента лежит откат к рабочему состоянию. Каждый шаг пишется в журнал, кто и что сделал видно поминутно. За инцидент на проде отвечает человек, то есть я, а не агент. Когда вам продают «ИИ всё сделает сам без присмотра» — это и есть красный флаг.

Экономика

Что это даёт в деньгах

Сравниваю честно с двумя привычными вариантами. Со своей дежурной сменой и с классическим аутсорсом часов.

Штатная эксплуатация

За что платите
Фонд оплаты, налоги, оборудование, ночные дежурства
Скорость реакции
Зависит от свободного человека и смены
Доступность
Проседает в отпуска, болезни, текучку
Кто отвечает за прод
Дежурный инженер

Классический аутсорс

За что платите
Часы подрядчика по тарифу
Скорость реакции
Медленно, мотив подрядчика тянуть часы
Доступность
По регламенту договора, чаще в рабочие часы
Кто отвечает за прод
Размыто между сторонами

AI Service Desk

За что платите
Подключение плюс абонентское ведение по объёму
Скорость реакции
Тикет берётся в момент появления
Доступность
Круглосуточно, без человеческого фактора
Кто отвечает за прод
Один ответственный эксперт, это я

Вы платите за результат одному ответственному эксперту с понятной зоной ответственности вместо содержания дежурной линии. Инциденты и заявки закрываются быстрее, потому что агент берёт тикет сразу. Разница в расходах против штата кратная, в разы, а не в проценты. Точную цифру считаю под ваш объём на разборе.

Форматы

Как начать и в каком формате вести

Два шага. Сначала разовое подключение и настройка. Потом абонентское ведение по объёму. Можно остановиться после первого шага, если хотите сначала получить рабочий мониторинг и тикеты, а ведение взять позже.

Шаг 1

Подключение и настройка (разовый старт)

Ставлю мониторинг и трассировку ошибок, описываю сценарии типовых инцидентов, настраиваю правила эскалации, подключаю агентов к вашим процессам и доступам по минимально необходимому принципу. На выходе — работающий контур и понятная граница автономии под вашу инфраструктуру.

Цена: по результату разбора

Шаг 2

Абонентское ведение Service Desk (по объёму)

Веду мониторинг, инциденты и запросы на постоянной основе. Объём считается по нагрузке: число систем под присмотром, поток тикетов и заявок, ритм плановых операций. Ежемесячный отчёт о закрытых инцидентах и заявках. Риск-действия согласую отдельно по каждому.

Цена: по результату разбора

Точную стоимость называю после разбора. Она зависит от объёма систем и потока обращений, гадать вслепую не берусь.

Доказательство

Это уже работает на проде

Я не рассказываю про модель в теории. Я веду по ней боевую систему с живыми пользователями и реальными деньгами в обороте. Мониторинг ошибок через Hawk, конвейер поставки с автоматическими проверками, агенты на проде в границах безопасного. Четыре реальных факапа с этого проекта я разобрал в большом материале честно, с уроком из каждого.

Клиента не называю под NDA. Метод, стек и принципы описаны полностью.

Читать разбор: «Production-CRM в одиночку, командой ИИ-агентов»
Частые вопросы

Частые вопросы

Агент сам полезет на мой прод?
Только в границах обратимого и безопасного. Перезапуск процесса, чистка кэша, откат кода на рабочий релиз, типовая выдача данных идут без меня. Миграцию схемы, операции с деньгами, удаление данных и смену секретов агент сам не трогает. Он готовит такое действие и ждёт моего подтверждения с планом и точкой отката.
Кто отвечает за инцидент на проде?
Человек. Я. Агент делает работу, но право на риск-действие и ответственность за последствия остаются за мной. Это зашито в саму модель, а не подразумевается на словах.
Что с 152-ФЗ и доступами?
Персональные данные обрабатываются на вашей инфраструктуре под вашим контролем. Доступы агентам выдаются по минимально необходимому принципу, как живому сотруднику. Все действия пишутся в журнал. Риск-операции с данными требуют подтверждения. Конкретику под ваши требования разбираю отдельно перед стартом.
Чем это отличается от штатного DevOps?
Штатный инженер — это фонд оплаты, ночные дежурства и провал в отпуск или болезнь. Здесь рутину держат агенты круглосуточно, а инженерную планку и ответственность держу я один. Вы платите за результат и зону ответственности, а не за содержание дежурной линии. Скорость реакции выше, потому что агент берёт тикет сразу.
А если агент ошибётся?
Под каждым его действием лежит откат к рабочему состоянию, а необратимое он без меня не делает. Поэтому худший реалистичный случай — короткий откат на предыдущий рабочий релиз, а не катастрофа. Каждый шаг в журнале, причину видно сразу. На том проекте четыре сбоя закрылись именно так. В процессе был человек с правом стоп-крана.
Сколько стоит против штата?
Подключение плюс абонентское ведение по объёму против фонда оплаты дежурной смены. Разница кратная, в разы. Точная цифра зависит от числа систем под присмотром и потока обращений, я считаю её на разборе под ваш случай.
Разбор за 30 минут

Разберём вашу эксплуатацию за 30 минут

Покажу, что из мониторинга, инцидентов и заявок можно отдать агентам, а что оставить людям. Без обязательств. Если задача не моя, скажу честно и порекомендую коллег.

Отвечу в рабочее время, Пн–Пт 09:00–19:00 MSK.

Короткая форма

Коротко о задаче. Этого достаточно для первого ответа.

Телефон, email или Telegram (@логин) — как удобнее.

Данные не передаются третьим лицам. Реакция в течение 4 часов в рабочее время.

Срочный вход

ИТ уже горит? Звоните сейчас

Если у вас прямо сейчас лежит прод, теряются данные или встал релиз, не ждите письма. Наберите напрямую, разберёмся по горячим следам.

Телефон и Telegram открываются по клику. Контакты не светятся в коде страницы, это защита от скраперов.