Skip to content

Метрики

DORA Metrics

Основные метрики эффективности инженерной команды:

МетрикаОписаниеЦелевое значение
Deployment FrequencyКак часто деплоим в продакшенНесколько раз в день
Lead Time for ChangesВремя от коммита до продакшена< 1 день
Change Failure Rate% деплоев, вызвавших инцидент< 5%
Time to RestoreВремя восстановления после сбоя< 1 час

Как измеряем

  • Deployment Frequency — из CI/CD пайплайна
  • Lead Time — от первого коммита в PR до деплоя
  • Change Failure Rate — из incident tracker
  • MTTR — из incident management системы

SPACE Framework

Дополнительные метрики для оценки продуктивности:

ИзмерениеЧто оцениваетПримеры метрик
SatisfactionУдовлетворённость разработчиковSurvey score
PerformanceРезультаты работыStory points delivered, bugs fixed
ActivityАктивностьPRs/commits, code reviews
CommunicationКоллаборацияReview turnaround, knowledge sharing
EfficiencyЭффективностьCI time, time in review, flow state

Технические метрики

RED (для сервисов)

  • Rate — количество запросов в секунду
  • Errors — процент ошибочных ответов
  • Duration — latency (p50, p95, p99)

USE (для инфраструктуры)

  • Utilization — загрузка ресурса (CPU, memory, disk)
  • Saturation — очередь (queue depth, goroutines)
  • Errors — ошибки инфраструктуры

Дашборды

ДашбордСодержание
Service OverviewRED метрики всех сервисов
InfrastructureUSE метрики серверов
DORAМетрики команды
BusinessБизнес-метрики

Алертинг

Принципы

  1. Алерт должен требовать действия — не alert fatigue
  2. Критичные алерты — в PagerDuty, не в почту
  3. Каждый алерт имеет runbook
  4. Регулярный ревью алертов — удаляем неактуальные

Уровни

УровеньКаналВремя реакции
CriticalPagerDuty + звонок< 5 мин
WarningSlack #alerts< 30 мин
InfoSlack #monitoringРабочие часы