Что случилось

3 мая 2026, 09:14 по Москве. Я делал тюнинг Valkey на собственном VPS. Добавил io-threads=2 в valkey.conf, перезапустил сервис. Через 30 секунд 77 из 82 публичных страниц сайта возвращали 500 Internal Server Error. Узнал я об этом через 10 минут, когда открыл сайт сам, чтобы проверить, что всё штатно.

Если бы у меня стояло error tracking, я узнал бы за 30 секунд. Алерт бы пришёл в Telegram до того, как первый клиент успел увидеть 500-ю. Это RCA не про Valkey. Это про то, почему я ставлю error tracking в первый деплой, а не в третий.

Пост для CIO и CTO, которые откладывают наблюдение «до реального трафика». Внутри живой ход событий, цифры стоимости простоя, сравнение Sentry с альтернативами (российский Hawk от CodeX, OSS-GlitchTip и SigNoz), разбор 152-ФЗ и санкций, рецепт установки на 10 минут и связка с Service Desk по ITIL.

Контекст

VPS Timeweb, Debian 13, multi-tenant. WordPress + Roundcube webmail + несколько вспомогательных сервисов на одном сервере. Я веду его сам. Держу руку на пульсе и обкатываю на нём всё, что потом несу клиентам.

Стек кэширования двухслойный. Первый слой это WP Super Cache, он складывает готовый HTML в файлы и отдаёт через nginx минуя PHP. Второй слой это WP Redis Object Cache, встраиваемый модуль ядра (drop-in) wp-content/object-cache.php от Till Krüss. Он хранит результаты get_option() и SQL-запросов в Valkey, чтобы PHP не дёргал MariaDB на каждом хите.

Drop-in при старте читает state из Valkey. Если Valkey пустой или недоступен, drop-in кидает fatal в PHP. WordPress без drop-in отдал бы 500 на ВСЕХ страницах. Но WP Super Cache независимо от PHP отдавал HTML-файлы пяти страниц, которые были закэшированы за минуту до restart (главная, /uslugi/, /o-kompanii/, /contacts/ и одна посадочная). Поэтому 5 работали, 77 нет.

Эта деталь важна для понимания, почему я не заметил инцидент сразу. Главная отдавала 200, я открыл её для быстрой проверки после restart Valkey, увидел нормальный ответ и пошёл дальше. RCA ниже про это.

Реальный timeline без error tracking

Время	Событие	Источник
09:13:50	Отредактировал /etc/valkey/valkey.conf, добавил io-threads 2 и io-threads-do-reads yes.	vim history
09:14:00	systemctl restart valkey-server. Valkey очистился (save="", persistence отключена).	systemctl
09:14:03	Valkey слушает 6379, отдаёт PONG на ping. Я успел проверить, выглядит ok.	valkey-cli ping
09:14:05	Первый запрос на главную после restart. drop-in пытается reconnect, делает SELECT на пустой Valkey, ловит fatal.	php-fpm error log
09:14:05	WP Super Cache на главной отдал свой .html файл. nginx вернул 200. Я этого не вижу.	supercache log
09:14:08	Запрос на /uslugi/arenda-avtobusov/. .html нет, идёт через PHP. drop-in fatal, отдал 500.	nginx access log
09:14:10	Первый клиент получил 500. Я не знаю.	Я.Метрика (постфактум)
09:15:00	Открыл главную в браузере для проверки. Вижу 200, контент свежий. Закрываю вкладку.	Chrome history
09:15–09:24	Продолжаю работать с другими задачами. На сайт не смотрю.	—
09:24:12	Открыл /uslugi/arenda-avtobusov/ для несвязанной задачи. Получил 500.	—
09:24:30	Понял, что Valkey restart сломал drop-in. Открыл /o-kompanii/, там 200. Открыл /shiryayevo/, там 500.	manual curl smoke
09:25	Прогон curl по 82 URL из sitemap. 77 страниц вернули 500.	bash loop
09:25–09:34	Recovery по 8-шаговой процедуре. rm drop-in, FLUSHALL, reload PHP-FPM, wp redis enable.	session log
09:34:15	Все 82 URL вернули 200. Восстановлено.	smoke loop
09:14:10 → 09:34:15	Суммарный простой для 77 страниц составил 20 минут 5 секунд. Сколько клиентов попало на 500, посчитал в Я.Метрике позже, см. ниже.	Я.Метрика

Что я узнал из Метрики постфактум

За 20 минут простоя на сайт зашло 14 уникальных посетителей. Из них 11 попали на страницы из 77 битых. У этих 11 отказ 100%. Конверсий 0. Заявок 0. Дальше грубая прикидка, порядок величин. 11 посетителей при конверсии в заявку 3–5% это 0.3–0.5 потерянной заявки. При конверсии заявки в сделку около 20% и чеке сделки 30–100 тыс ₽ упущенная выручка получается порядка 2–10 тыс ₽ за один инцидент.

Для среднего B2B с трафиком 500 посетителей/час арифметика другого порядка. Те же 20 минут это 150–200 потерянных посетителей, при тех же конверсиях 1–3 потерянные сделки и упущенная выручка в сотнях тысяч рублей.

Что Sentry показал бы за 30 секунд

Перепроиграю timeline в альтернативной вселенной, где Sentry (или GlitchTip, что для этого сценария идентично) стоит и подключён.

Время	Событие в Sentry
09:14:05	Первый PHP fatal Cannot redeclare WP_Object_Cache залетел в Sentry. Event group создан.
09:14:08	Второй fatal от другого URL. Sentry группирует по stack-trace в существующий event. Счётчик 2.
09:14:10–09:14:30	Всплеск ошибок. 40+ событий в той же группе за 20 секунд. Правило Sentry «error spike» срабатывает.
09:14:30	Webhook в Telegram-канал #alerts. Текст: «WordPress drop-in fatal, 40 events, 12 affected users, see https://...».
09:14:30	Мне приходит уведомление на телефон. Открываю Sentry. Вижу stack-trace, цепочку последних действий, env=prod, release=wp-6.4.3-supercache-1.12.
09:14:45	Понимаю причину (Valkey restart), запускаю recovery. Полное восстановление через 9 минут с момента алерта.
Итого	Простой сократился бы с 20 минут до 10. Потерянных посетителей с 11 до 5. Стоимость инцидента ниже примерно вдвое.

Что в Sentry на этом stack-trace

Один error event Sentry даёт мне всё, что нужно для решения за 30 секунд.

Stack-trace с указанием файла и строки, где fatal. Здесь это wp-content/object-cache.php:124.
Breadcrumbs, последние действия до падения. Видно, что drop-in вызвал connect() и получил RedisException: Connection refused.
Tags, тут окружение, версия PHP, версия плагина, hostname сервера, release HEAD.
Affected users count, сколько уникальных посетителей словили fatal. Здесь 12.
First seen / Last seen, окно от первого события до последнего. Помогает понять, fixed уже или катится.

Это та же информация, что я собирал руками 9 минут. Читал логи, пробивал URL, прогонял curl-цикл. Sentry даёт это в один клик.

Почему я не поставил Sentry заранее

У меня было три отговорки. Все рационализации, не причины.

Отговорка 1. «Pre-launch, нет трафика». На этом сайте трафик небольшой (50–200 посетителей/день), и я решил, что error tracking нужен «когда станет больше». На деле стоимость одного клиента в B2B-нише с чеком 30–100 тыс ₽ оправдывает наблюдение за каждой 500-й даже на пяти посетителях в день.

Отговорка 2. «Тяжёлый по ресурсам, нагрузит сервер». Я думал, что Sentry требует много памяти. Это правда для полного Sentry self-host. Официальные требования репозитория getsentry/self-hosted это 4 ядра CPU, 16 ГБ RAM плюс 16 ГБ swap, рекомендовано 32 ГБ. Но GlitchTip требует 256 МБ. Это совместимая замена под те же Sentry SDK, код приложения не меняется. На любом VPS от 1500 ₽/мес он помещается рядом с приложением без боли.

Отговорка 3. «Сложно настроить». Установка GlitchTip через docker compose занимает 10 минут. Подключение к Next.js это 7 строк. Подключение к PHP 4 строки. Это меньше, чем я потратил на recovery.

Все три отговорки это классическая ловушка приоритезации. Я ставил «как удобно», а должен был ставить «как надёжно». Наблюдение стоит пары часов и пары сотен МБ RAM. Отсутствие наблюдения стоит потерянных посетителей и подорванного доверия.

Альтернативы Sentry. Таблица

В 2026 году Sentry SaaS для российских компаний практически закрыт. Серверы Sentry в США и Европе нарушают локализацию 152-ФЗ (см. секцию ниже). Stripe не принимает российские карты, а оплата через зарубежное юрлицо это серая зона. Sentry self-host технически работает, но лицензия FSL 1.1 не FOSS, а source-available.

Поэтому я разделил решения на два сегмента, для малой команды и для среднего/крупного бизнеса. Сравнение собрано из research-отчёта 21 мая 2026 с проверкой по официальным репозиториям. Цены актуальны на момент публикации.

Сегмент SMB (1–50 разработчиков, до 1М events/день)

Название	Лицензия	Min RAM	Sentry SDK drop-in?	152-ФЗ self-host?	Цена
GlitchTip	MIT (FOSS)	256 МБ	Да, полная	Да, любой VPS в РФ	Self-host бесплатно
Bugsink	PolyForm Shield (source-available)	~512 МБ	Да, полная	Да	Self-host бесплатно для не-конкурентов
Hawk (hawk.so)	BSL 1.1 (CodeX)	Self-host ~2 ГБ	Свои SDK + приём Sentry-DSN для миграции	Да, российский лендинг заявляет хранение в РФ	Free 1000 событий/мес, далее от 99 ₽/мес
Sentry self-host	FSL 1.1 → Apache 2.0 через 2 года	от 16 ГБ + 16 ГБ swap	Да, native	Да	Self-host бесплатно с ограничением «competing uses»

Сегмент Mid/Large (50+ разработчиков, миллионы events/день)

Название	Лицензия	Min RAM	SDK	152-ФЗ self-host?	Цена
SigNoz	MIT core + EE proprietary	4–8 ГБ	OpenTelemetry	Да	Self-host бесплатно, Enterprise SaaS от $4000/мес
Apache SkyWalking	Apache 2.0 (FOSS)	4 ГБ+	Native agents + OTel	Да	Полностью бесплатно
HyperDX	MIT (FOSS, теперь часть ClickHouse Inc.)	4–8 ГБ	OTel + native	Да	Self-host бесплатно
Grafana OSS-стек (Tempo + Loki + Pyroscope + Faro)	AGPLv3 (Faro SDK — Apache 2.0)	6–16 ГБ	OpenTelemetry + Faro frontend	Да	Полностью бесплатно

Что я выбрал бы под три типичных сценария

Малая команда до запуска, 1–5 разработчиков → GlitchTip self-host рядом с приложением на том же VPS. 256 МБ RAM, MIT-лицензия, совместимость со всеми Sentry SDK без правки кода. При росте миграция в SigNoz через перевод кода на OpenTelemetry.

Российское юрлицо, нет ресурсов на self-host → Hawk от команды CodeX, счёт в рублях. Канонический адрес экосистемы это hawk.so (там SDK @hawk.so/* и документация docs.hawk.so). Российский лендинг того же CodeX живёт на hawk-tracker.ru. На нём прямо заявлено «храним данные в РФ, не передаём за рубеж» и «152 ФЗ», разработчик указан как российская команда из Санкт-Петербурга, регистрация self-service, от 99 ₽/мес. У Hawk собственные SDK (@hawk.so/nodejs, .javascript, .php, .python, .go) плюс приём Sentry-DSN для миграции. Полную замену кода Sentry без правок на боевом проекте проверьте заранее. Под оператора ПДн запросите у вендора письменное подтверждение локализации и поручение на обработку по ст. 6 ч. 3 152-ФЗ.

Среднее предприятие 20–50 разработчиков на проде → SigNoz self-host + OpenTelemetry-инструментация. Единый стек traces+metrics+logs+errors, ClickHouse-storage на миллионы events/день, нет vendor lock. Как альтернатива, стек Grafana, если она у вас уже стоит.

Поправка про Sentry лицензию. До 2024 года Sentry был на BSL (Business Source License), что часто называли «не FOSS, нельзя трогать». С 2024 Sentry перешёл на Functional Source License 1.1, где каждая версия через 2 года автоматически становится Apache 2.0. Self-host для внутреннего использования разрешён. Запрещено только предлагать конкурентный SaaS на их коде. Источник смотрите в LICENSE.md в репозитории.

152-ФЗ и где хранятся данные

Sentry собирает по умолчанию больше данных, чем кажется. В типичный event попадает IP-адрес посетителя, user-id (если вы передаёте), цепочка последних действий пользователя (breadcrumbs), заголовки запроса, query-параметры URL, иногда тело запроса. Всё это персональные данные по 152-ФЗ.

Ключевую норму задаёт статья 18 часть 5 закона 152-ФЗ. Она требует, чтобы при сборе ПДн граждан РФ запись, систематизация, накопление, хранение, уточнение и извлечение этих данных проводились с использованием баз данных, находящихся на территории РФ. Полный текст закона лежит на consultant.ru, нужный пункт ищите в статье 18 части 5.

Sentry SaaS хранит данные в США (us.sentry.io) или Германии (de.sentry.io). Для приложения с российскими пользователями это формальное нарушение. Self-hosted Sentry или GlitchTip в РФ-датацентре закрывает требование. У CodeX есть российский лендинг hawk-tracker.ru, на нём прямо заявлено хранение данных в РФ («храним данные в РФ, не передаём за рубеж») и соответствие 152-ФЗ. Для оператора ПДн это рабочий вариант без выноса данных за рубеж. Перед прод-выбором запросите у вендора письменное подтверждение локализации и договор-поручение на обработку по ст. 6 ч. 3 152-ФЗ.

Что точно настроить перед выкаткой

Даже на self-hosted в РФ хранить лишние ПДн без необходимости нельзя (152-ФЗ ст. 5 ч. 1, минимизация). В коде нужны три настройки.

beforeSend hook. Маскирует чувствительные поля в каждом event перед отправкой. Удаляет cookies, Authorization, Cookie, X-CSRF-Token, session-id из request-headers.
denyUrls / ignoreErrors. Не собирать ошибки с тех URL и тех типов исключений, что не нужны для отладки (например, ошибки сторонних расширений в браузере).
sendDefaultPii: false. Sentry по умолчанию посылает IP и user-id. Отключаем и передаём только нужное явно.

Дополнительно с 30 мая 2025 действует ФЗ-420 от 30 ноября 2024 года, который ужесточил ст. 13.11 КоАП. Важно не валить разные составы в одну строку, суммы у них сильно отличаются. Для юрлица актуальные размеры такие.

100–300 тыс ₽ за неуведомление Роскомнадзора о начале обработки ПДн (ч. 10 ст. 13.11).
300–700 тыс ₽ за обработку без письменного согласия субъекта (ч. 2), при повторном нарушении 1–1,5 млн ₽ (ч. 2.1).
1–6 млн ₽ за нарушение локализации, то есть хранение ПДн граждан РФ вне РФ (ч. 8), а при повторе 6–18 млн ₽ (ч. 9). Это и есть тот самый состав, под который попадает дефолтный SaaS Sentry в США или Германии.
1–3 млн ₽ за несообщение об утечке (ч. 11), а за саму утечку штрафы доходят до миллионов с оборотными составами при повторе. Отдельная тема, error tracking сюда попадает только если из него утекут собранные ПДн.

Источники по составам и суммам это КонсультантПлюс и текст ст. 13.11 КоАП.

Практический вывод. Если вы внедряете error tracking как оператор ПДн в РФ, нужно (1) уведомлением в РКН отразить обработку через Sentry/GlitchTip/Hawk как отдельный процесс, (2) выбрать self-host в РФ или российский SaaS с локализацией в РФ (Hawk через hawk-tracker.ru заявляет такое хранение), (3) настроить чистку персональных данных в коде. Это разовая работа на 1–2 дня, экономия штрафов до миллионов рублей.

Санкции и план Б

Sentry Inc. это компания из Сан-Франциско. На середину 2026 года она формально не отказала российским клиентам, но риск блокировки актуален. Atlassian (Jira, Confluence), Datadog, NewRelic, Slack уже закрыли доступ для российских клиентов в 2022–2024 годах. Sentry в любой момент может присоединиться.

Второй риск. Оплата. Sentry SaaS принимает оплату через Stripe. Stripe не работает с российскими картами с 2022 года. Обход через зарубежное юрлицо технически возможен, но это серая зона.

Третий риск. Docker images. Были прецеденты частичных блокировок Docker Hub для российских IP в 2022–2023 (правда, быстро откатили). Для self-host Sentry это значит, что download образов в один прекрасный день может перестать работать.

План Б. Совместимая замена на тех же SDK

Главный аргумент в пользу GlitchTip и Bugsink. Они принимают данные по тому же протоколу, что Sentry. Это значит, что ваш код (sentry-python, sentry-javascript, sentry-php, @sentry/nextjs) остаётся неизменным. Меняется только DSN-переменная в окружении.

Если Sentry заблокируют завтра, миграция выглядит так. (1) Поднять GlitchTip self-host рядом с приложением. (2) Сменить SENTRY_DSN на адрес своего GlitchTip. (3) Перезапустить приложение. Всё. Никакой переписки кода. Данные старого Sentry остаются в SaaS до конца оплаченного периода. Новые события идут в GlitchTip.

Это страховка ценой 256 МБ RAM. Я ставлю её клиентам сразу. Даже если они используют Sentry SaaS, на VPS рядом стоит выключенный GlitchTip. Если завтра Sentry закрылся, переключение занимает 30 секунд.

Российские облака как полный аналог Sentry на 2026 год не выработались. Yandex Cloud Monitoring предлагает Traces, Logs и Metrics как отдельные продукты, но интерфейса для группировки ошибок по stack-trace на уровне Sentry там нет. VK Cloud и Selectel предлагают только базовые metrics+logs. Hawk от CodeX ближе всего к Sentry-аналогу и не зависит от санкций. Российский лендинг hawk-tracker.ru заявляет хранение данных в РФ, есть и self-host (BSL 1.1, source-available).

GlitchTip за 10 минут на том же VPS

Это рабочий рецепт для SMB. Я использую его на новых клиентских проектах. По официальному пути надо взять их compose.sample.yml из документации. Ниже мой обрезанный вариант для одного VPS, его проще читать в посте. Допущения. Один VPS с Debian/Ubuntu, Docker и Docker Compose установлены, домен errors.example.ruнаправлен на этот VPS, nginx с Let's Encrypt уже настроен.

bash
# Шаг 1. Создать рабочую директорию
mkdir -p /opt/glitchtip && cd /opt/glitchtip

# Шаг 2. Сгенерировать секреты
SECRET_KEY=$(openssl rand -hex 50)
DB_PASS=$(openssl rand -hex 24)

# Шаг 3. docker-compose.yml — минимальная all-in-one конфигурация
cat > docker-compose.yml <<EOF
services:
  postgres:
    image: postgres:16
    environment:
      POSTGRES_USER: glitchtip
      POSTGRES_PASSWORD: ${DB_PASS}
      POSTGRES_DB: glitchtip
    volumes: [pgdata:/var/lib/postgresql/data]
    restart: unless-stopped

  redis:
    image: valkey/valkey:8.0-alpine
    restart: unless-stopped

  web:
    image: glitchtip/glitchtip:latest
    depends_on: [postgres, redis]
    environment:
      DATABASE_URL: postgres://glitchtip:${DB_PASS}@postgres:5432/glitchtip
      SECRET_KEY: ${SECRET_KEY}
      EMAIL_URL: smtp://localhost:25
      GLITCHTIP_DOMAIN: https://errors.example.ru
      DEFAULT_FROM_EMAIL: errors@example.ru
    ports: ["8000:8000"]
    restart: unless-stopped

  worker:
    image: glitchtip/glitchtip:latest
    depends_on: [postgres, redis]
    environment:
      DATABASE_URL: postgres://glitchtip:${DB_PASS}@postgres:5432/glitchtip
      SECRET_KEY: ${SECRET_KEY}
    command: ./bin/run-celery-with-beat.sh
    restart: unless-stopped

volumes:
  pgdata:
EOF

# Шаг 4. Запустить
docker compose up -d

# Шаг 5. Создать первого админа
docker compose exec web ./manage.py createsuperuser

После шага 5 открываете https://errors.example.ru в браузере, логинитесь, создаёте проект, копируете DSN из настроек проекта и сохраняете его в переменную окружения приложения как SENTRY_DSN. Готово.

Nginx-прокси перед GlitchTip

GlitchTip слушает на :8000. Перед ним нужен nginx с TLS-завершением. Минимальный конфиг ниже.

nginx
server {
    listen 443 ssl http2;
    server_name errors.example.ru;

    ssl_certificate /etc/letsencrypt/live/errors.example.ru/fullchain.pem;
    ssl_certificate_key /etc/letsencrypt/live/errors.example.ru/privkey.pem;

    client_max_body_size 50M;

    location / {
        proxy_pass http://127.0.0.1:8000;
        proxy_set_header Host \$host;
        proxy_set_header X-Real-IP \$remote_addr;
        proxy_set_header X-Forwarded-For \$proxy_add_x_forwarded_for;
        proxy_set_header X-Forwarded-Proto https;
    }
}

Расход ресурсов на проде. На моём VPS GlitchTip all-in-one занимает 280 МБ RAM в покое и до 450 МБ под нагрузкой в 100 events/мин. CPU держится в пределах 1-3% на 4 ядрах. Диск PostgreSQL под GlitchTip растёт примерно 50 МБ на 100 тыс events. Для личного проекта этого хватает с запасом на годы.

Подключение Next.js, FastAPI, PHP, 1С

Дальше я покажу, как подключить error tracking к четырём типичным стекам. Везде используется DSN от GlitchTip (формально это SENTRY_DSN, обратная совместимость с Sentry полная).

Next.js (App Router, версия 15+)

bash
pnpm add @sentry/nextjs

# Запустить интерактивный wizard, который создаст sentry.client.config.ts,
# sentry.server.config.ts, sentry.edge.config.ts и обновит next.config.ts:
npx @sentry/wizard@latest -i nextjs

Wizard просит DSN, имя проекта, разрешение на загрузку source-maps. После него в коде ничего не нужно. Ошибки на сервере и в клиенте отправляются автоматически. Для ручной отправки события:

typescript
import * as Sentry from "@sentry/nextjs";

try {
  await chargeCustomer(input);
} catch (error) {
  Sentry.captureException(error, {
    tags: { feature: "billing", env: "prod" },
    user: { id: session.userId },
  });
  throw error;
}

Ключевая фича для Next.js это source-maps. Без них stack-trace в проде показывает минифицированный код. Wizard включает их по умолчанию через withSentryConfig в next.config.ts. Проверьте, что в CI на каждый deploy уплывает release-тэг это позволяет фильтровать события по версии и быстро локализовать регрессию.

FastAPI (Python 3.11+)

bash
pip install sentry-sdk[fastapi]

python
# app/main.py
import sentry_sdk
from sentry_sdk.integrations.fastapi import FastApiIntegration
from sentry_sdk.integrations.starlette import StarletteIntegration

sentry_sdk.init(
    dsn=os.environ["SENTRY_DSN"],
    environment=os.environ.get("APP_ENV", "dev"),
    release=os.environ.get("GIT_SHA", "unknown"),
    integrations=[
        StarletteIntegration(),
        FastApiIntegration(),
    ],
    traces_sample_rate=0.1,  # 10% запросов в performance traces
    send_default_pii=False,  # 152-ФЗ minimization
    before_send=lambda event, hint: scrub_pii(event),
)

def scrub_pii(event):
    # Маскирует cookies и Authorization в request.headers
    if "request" in event and "headers" in event["request"]:
        for key in ["cookie", "authorization", "x-csrf-token"]:
            event["request"]["headers"].pop(key, None)
    return event

PHP (Laravel/Symfony/чистый PHP)

bash
composer require sentry/sentry

php
<?php
\Sentry\init([
    'dsn' => $_ENV['SENTRY_DSN'],
    'environment' => $_ENV['APP_ENV'] ?? 'dev',
    'release' => $_ENV['GIT_SHA'] ?? 'unknown',
    'send_default_pii' => false,
    'before_send' => function (\Sentry\Event $event): ?\Sentry\Event {
        $request = $event->getRequest();
        unset($request['cookies']);
        unset($request['headers']['cookie']);
        $event->setRequest($request);
        return $event;
    },
]);

Для WordPress есть плагин WP Sentry от Stayallive. Он оборачивает wp-config.php и ловит fatal errors, warnings и notices. Я поставил его после инцидента. Установка занимает 5 минут.

1С (через HTTP-сервис)

Нативного Sentry SDK для 1С нет, но есть рабочая схема через HTTP-сервис, опубликованный на Apache + 1С Web-сервер. В серверном коде 1С ловите исключения и шлёте POST на envelope endpoint. Важная деталь, на которой спотыкаются. Свежий GlitchTip принимает события только в формате Sentry envelopes на URL /api/<project>/envelope/, а не на старый /store/. Конверт начинается с JSON-заголовка, затем идут элементы, разделённые переводом строки. Заголовок конверта с event_id и dsn, заголовок элемента {"type":"event"}, затем сам JSON события. Для простого события с одним элементом это фактически три строки. Формально это не строгий NDJSON. Полезная нагрузка не обязана быть однострочной, см. спецификацию по ссылке. Content-Type здесь application/x-sentry-envelope.

bsl
Процедура ОтправитьОшибкуВSentry(ИнформацияОбОшибке) Экспорт
    DSN = ПолучитьDSNИзНастроек(); // https://<key>@errors.example.ru/<project>
    EventId = СтрЗаменить(Строка(Новый УникальныйИдентификатор), "-", "");

    // Сам объект события
    Событие = Новый Структура;
    Событие.Вставить("event_id", EventId);
    Событие.Вставить("timestamp", Формат(ТекущаяУниверсальнаяДата(), "ДФ='yyyy-MM-ddTHH:mm:ssZ'"));
    Событие.Вставить("level", "error");
    Событие.Вставить("platform", "other");
    Событие.Вставить("environment", "prod");
    Событие.Вставить("release", "1c-erp-2.5.26.110");
    Событие.Вставить("message", ПодробноеПредставлениеОшибки(ИнформацияОбОшибке));
    Событие.Вставить("tags", Новый Структура("source", "1c"));

    // Собираем конверт: для простого события это 3 строки
    ЗаголовокКонверта = Новый Структура("event_id, dsn", EventId, DSN);
    ЗаголовокItem = Новый Структура("type", "event");

    Тело = ВСтрокуJSON(ЗаголовокКонверта) + Символы.ПС
        + ВСтрокуJSON(ЗаголовокItem) + Символы.ПС
        + ВСтрокуJSON(Событие);

    Заголовки = Новый Соответствие;
    Заголовки.Вставить("Content-Type", "application/x-sentry-envelope");
    Заголовки.Вставить("X-Sentry-Auth", СформироватьSentryAuth(DSN));

    HTTPЗапрос = Новый HTTPЗапрос("/api/<project>/envelope/", Заголовки);
    HTTPЗапрос.УстановитьТелоИзСтроки(Тело);
    Соединение = Новый HTTPСоединение(ИзвлечьХост(DSN), 443, , , , Истина);
    Соединение.ОтправитьДляОбработки(HTTPЗапрос);
КонецПроцедуры

Здесь ВСтрокуJSON работает обёрткой над ЗаписьJSON, которая сериализует структуру в одну строку. Код пишется один раз и кладётся в общий модуль с глобальной обёрткой Попытка ... Исключение на критичных операциях (проведение документов, начисления, обмен). После этого фактические сбои 1С попадают в тот же Sentry/GlitchTip, что и веб, и видны на одном экране CIO. Точный формат конверта и поля аутентификации сверяйте по ссылке выше, схема живая и иногда меняется.

Связь с Service Desk по ITIL

Алерт в Telegram это полумера. Алерт пришёл, инженер увидел, инженер починил. След от инцидента остался только в чате (через неделю не найти) и в логах Sentry (можно найти, но неудобно). Для зрелого ИТ-процесса этого мало. По ITIL incident это запись в Service Desk с категорией, приоритетом, назначенным владельцем и SLA-таймером.

Sentry умеет вебхуки. На каждое срабатывание правила (новая группа ошибок, всплеск, повторное появление после фикса) он отправляет POST на ваш URL. Этот URL может быть Service Desk напрямую (если он принимает вебхуки) или сервис-посредник, который преобразует данные Sentry в формат тикета.

Severity mapping

Сначала договариваемся, как уровень в Sentry превращается в приоритет инцидента ITIL.

Sentry level	ITIL приоритет	SLA реакции	Кто получает
fatal	P1 Critical	15 минут	On-call инженер + руководитель ИТ + дежурный CIO
error (spike, regression)	P2 High	1 час	On-call инженер + командный канал
error (новая группа)	P3 Medium	4 часа	Командный канал, разбирает дежурный по очереди
warning	P4 Low	1 рабочий день	Tag в Sentry, без тикета
info / debug	Не тикет	—	Только в Sentry, для отладки

Service Desk платформы, актуальные для РФ 2026

Atlassian (Jira Service Management) и ServiceNow в 2022–2023 закрыли продажи в РФ. Я использую следующие альтернативы у клиентов.

Naumen Service Desk. Российский enterprise ITSM, ITIL-сертифицирован, есть API для приёма тикетов через REST. Сильный игрок в крупном бизнесе.
ITSM 365. Облачный SaaS на платформе Naumen, для среднего бизнеса. Есть API.
Yandex Tracker. Формально task tracker, но умеет работать как Service Desk при правильной настройке очередей и SLA. API нормальный, доступ для РФ открыт.
1С:Документооборот 3.0. Если бизнес уже на 1С, можно вести инциденты в нём. Не идеально по UX, но данные остаются в одном контуре.
OTRS / Zammad / GLPI. Open-source ITSM (AGPL/MIT), self-host. Я ставлю их у клиентов с малым бюджетом, у кого нет лицензий на Naumen.

Middleware-сервис между Sentry и Service Desk

Прямой вебхук от Sentry в Service Desk почти никогда не работает. Нужен сервис-посредник, который делает 4 вещи. Обогащает данные (добавляет окружение, версию, число затронутых пользователей, ссылку на запись сессии и на runbook). Дедуплицирует (одна группа ошибок, один тикет, а не 1000). Ограничивает частоту (не больше 1 тикета в минуту на правило). Назначает дежурного по расписанию.

python
# middleware.py — FastAPI-микросервис между Sentry и Naumen SD
from fastapi import FastAPI, HTTPException
from datetime import datetime, timedelta
import httpx
import redis

app = FastAPI()
r = redis.Redis(host="localhost")
NAUMEN_API = "https://sd.example.ru/api/v1/incidents"
SENTRY_SECRET = os.environ["SENTRY_WEBHOOK_SECRET"]

LEVEL_TO_PRIORITY = {
    "fatal": "P1",
    "error": "P2",  # Дальше — корректируется по spike/regression
    "warning": "P4",
}

@app.post("/webhook/sentry")
async def receive(payload: dict, x_sentry_signature: str | None = None):
    if x_sentry_signature != SENTRY_SECRET:
        raise HTTPException(401, "bad signature")

    issue_id = payload["data"]["issue"]["id"]
    level = payload["data"]["issue"]["level"]

    # Дедупликация — один тикет на issue в течение часа
    if r.exists(f"sd:incident:{issue_id}"):
        return {"status": "dedup"}

    r.setex(f"sd:incident:{issue_id}", 3600, "1")

    priority = LEVEL_TO_PRIORITY.get(level, "P3")
    if "spike" in payload["data"].get("action", ""):
        priority = "P2"
    if "regression" in payload["data"].get("action", ""):
        priority = "P1"

    # Назначение по on-call rotation (упрощённо)
    assignee = get_oncall_engineer(datetime.now())

    body = {
        "title": f"[Sentry {priority}] {payload['data']['issue']['title']}",
        "description": render_description(payload),
        "priority": priority,
        "assignee": assignee,
        "category": "Software Error",
        "source": "Sentry",
        "external_id": issue_id,
        "sla_response_seconds": SLA[priority],
    }

    async with httpx.AsyncClient() as client:
        resp = await client.post(NAUMEN_API, json=body, headers=AUTH)
        resp.raise_for_status()

    return {"status": "ticket_created", "id": resp.json()["id"]}

Этот микросервис у меня живёт на том же VPS, что и GlitchTip, под FastAPI и systemd-юнитом. Расход ресурсов 30-50 МБ RAM. Поднимается за 20 минут.

Что даёт связка Sentry → Service Desk на практике

На проектах масштаба 200–250 человек картина типичная. До связки error tracking живёт в Telegram-канале, тикеты не заводятся. Технический отдел тратит часы в неделю на «расследование без следов». Пользователь жалуется устно, инженер ищет ошибку с нуля, история нигде не фиксируется. По порядку величин на таких проектах это половина рабочего дня в неделю на ровном месте.

После связки бо́льшая часть ошибок попадает в Service Desk автоматически. Внутренние пользователи видят, что инцидент «уже у IT в работе», и перестают дублировать обращения. Технический отдел разгружается, а история инцидентов за квартал лежит в одной системе. Для годового отчёта CIO это готовая база. Цифры здесь дают порядок величин на проектах такого масштаба, не точные замеры одного кейса.

Когда Sentry не поможет

Error tracking ловит только то, что само приложение успело сообщить. Есть классы инцидентов, для которых Sentry молчит.

Infrastructure-down. Apt purge dovecot из прошлого RCA положил dovecot полностью. Приложение даже не запустилось, Sentry молчал бы. Для такого нужен external uptime check (UptimeRobot, BetterStack, Healthchecks.io self-host).

Silent data corruption. Если ваш код спокойно записал в БД мусор без exception, Sentry не увидит. Для такого нужны runtime assertions (на критичных операциях), domain-валидация в БД (CHECK constraints, foreign keys), и ручной аудит данных раз в N дней.

Performance degradation без exceptions. Sentry умеет performance traces, но они дороже по storage. На SMB обычно выключены. Если API вместо 200 мс стал отвечать 5 секунд, и при этом ничего не упало, Sentry не показывает. Для такого нужен APM (SigNoz, Datadog, ваш Grafana-стек).

Сетевые проблемы между микросервисами. Service A ушёл к Service B, Service B упал, Service A обработал ответ как «empty result» вместо exception. Для такого нужен distributed tracing с context propagation (OTel + Jaeger/Tempo).

Поэтому Sentry не серебряная пуля. Это базовая страховка от одного класса проблем (необработанные исключения). В зрелом observability-стеке у вас есть ещё три уровня. External uptime checks, APM с performance traces, log aggregation с поиском. Я ставлю всё это поэтапно. Sentry первым, остальное по мере роста.

Цифры для CFO

Если вы как CIO защищаете бюджет на error tracking перед владельцем, ниже считалка. Считаем на трёх условных сценариях.

Сценарий 1. SMB с трафиком 50–200 посетителей/день

Один инцидент типа моего Valkey restart дал 11 потерянных посетителей, по грубой прикидке 0.3–0.5 заявки и порядка 2–10 тыс ₽ упущенной выручки. Допустим, такое случается 4 раза в год (раз в квартал что-то ломаю при тюнинге). Годовая упущенная выручка от инцидентов получается порядка 8–40 тыс ₽.

Стоимость error tracking. GlitchTip self-host на том же VPS стоит 0 ₽. Час моего времени на установку стоит 5–8 тыс ₽ альтернативная стоимость. Час на правила scrubbing PII и интеграцию ещё 5–8 тыс ₽. Итого инвестиция 10–16 тыс ₽, возврат за полгода-год.

Сценарий 2. Средний B2B с 500 посетителей/час

Один инцидент 20 минут даунтайма даёт 150 потерянных посетителей, 5–10 заявок, чек 50–200 тыс ₽, итого 250 тыс – 2 млн ₽ упущенной выручки за один случай. Допустим, 2 таких случая в год это 0.5–4 млн ₽.

Стоимость. GlitchTip self-host на отдельной VM с резервной копией PostgreSQL стоит около 1500–3000 ₽/мес инфраструктуры и 10– 20 ч/мес инженерного времени на сопровождение (20–50 тыс ₽/мес). Итого 250–650 тыс ₽/год. Окупаемость с первого предотвращённого инцидента.

Сценарий 3. Enterprise 20+ микросервисов

SigNoz self-host + OTel-инструментация. Один инцидент в цепочке микросервисов без observability стоит 4–8 часов на RCA с участием нескольких команд, 0.5–2 млн ₽ упущенной выручки плюс репутационный ущерб. Sentry/SigNoz сокращают RCA до 15– 30 минут.

Стоимость. Кластер из 3 VM под SigNoz + ClickHouse: 30–60 тыс ₽/мес инфраструктуры. Команда на сопровождение 0.5 FTE DevOps, 80–150 тыс ₽/мес. Лицензий нет (MIT). Итого 1.3–2.5 млн ₽/год. Окупаемость на 2–3 предотвращённых инцидентах.

TL;DR

Error tracking ставится в первый деплой. Не «когда станет больше трафика». Один потерянный B2B-клиент окупает год наблюдения.
Для российских компаний в 2026 Sentry SaaS закрыт (152-ФЗ + санкции + Stripe). Self-host или совместимая замена.
Малая команда до запуска → GlitchTip self-host рядом с приложением. MIT, 256 МБ RAM, те же Sentry SDK без правки кода. 10 минут установка.
Среднее предприятие 20–50 разработчиков → SigNoz + OTel. Один observability-стек для traces, metrics, logs, errors. Нет vendor lock.
Сразу настроить scrubbing PII (152-ФЗ ст. 5 ч. 1) и отразить обработку в уведомлении РКН.
План Б на случай санкционной блокировки. Совместимая замена через смену DSN. Код не меняется. Страховка 256 МБ RAM.
Связь с Service Desk через сервис-посредник обязательна при зрелом ITIL-процессе. Без него алерты теряются в мессенджерах.
Sentry не поможет с infrastructure-down, silent data corruption, performance degradation. Это базовый уровень, не вся observability.

Если вы CIO и думаете, какой инструмент выбрать под ваш сценарий, пишите. Я веду три тарифа консультаций и подбираю стек под бюджет и команду. Если хотите больше практических разборов, посмотрите остальные записи журнала, в частности «9 правил работы с AI-кодером» и «ITIL для 50–500 человек».

Первый разговор

Я работаю с этим напрямую — ознакомительный звонок 30 минут

Расскажете ситуацию — отвечу за 4 часа в рабочее время. Звонок бесплатный, без обязательств. Если задача не моя — порекомендую коллег, у которых она хорошо ляжет.

Ознакомительный звонок 30 минут Следующая статья — Практика · AI-кодинг