O que é um incidente? #
Um incidente é um alerta criado automaticamente pelo sistema sempre que uma métrica de desempenho ultrapassa os limites estabelecidos por regras de monitoramento. Existem dois tipos de regras:
- Regras Estáticas: definem um valor fixo em milissegundos (ms) como limite máximo para as métricas de DNS, latência ou processamento. Se o valor medido ultrapassar esse limite, um incidente será gerado.
- Regras Percentuais: consideram a média do dia anterior como referência. Um incidente é criado se:
- O valor medido ultrapassa um determinado percentual acima da média do dia anterior.
- A variação também for maior que um valor mínimo absoluto, para evitar ruídos.
Notas técnicas dos incidentes #
Cada incidente inclui uma nota técnica que descreve sua causa. Os tipos de incidentes são agrupados em duas categorias:
- Incidentes de Performance: gerados quando as métricas ultrapassam os limites definidos:
- DNS Elevado: Tempo para resolver o domínio excedeu o limite.
- Latência Elevada: Tempo de resposta entre a probe e o servidor foi alto.
- Processamento Elevado: O tempo gasto para processar a análise do site ultrapassou o esperado.
- Incidentes de status e conectividade da sonda: relacionados a falhas técnicas ou indisponibilidades:
- Falha de Conexão: A probe não conseguiu acessar o site por problemas de rede.
- Probe Offline: A probe está inativa há mais de 15 minutos.
- Probe Desativada: Se permanecer offline por mais de 48 horas, o sistema a desativa automaticamente.