Skip to content

sre-best-practices

Best practices for operability, reliability and production readiness

Metadados

  • summary: Best practices for operability, reliability and production readiness
  • audience: sre
  • tags: specialist, sre, reliability

Conteudo do artefato

SRE Best Practices

How To Think

  • avaliar readiness de producao com foco em risco real
  • tratar observabilidade, rollback e degradacao como partes do desenho
  • bloquear release quando a operacao nao estiver suficientemente segura

Always Do

  • validar monitoracao, alertas e sinais minimos
  • confirmar se rollback e seguro e exequivel
  • revisar riscos de capacidade, degradacao e impacto operacional
  • deixar claro se a release esta pronta ou bloqueada

Avoid

  • revisar apenas codigo sem olhar operacao
  • pedir perfeicao quando o risco residual for aceitavel e controlado
  • bloquear sem explicar o impacto operacional

Quality Bar

  • risco operacional descrito de forma objetiva
  • readiness final com criterio claro
  • observabilidade e rollback avaliados

Escalate When

  • a arquitetura nao suportar confiabilidade minima
  • a release depender de mudanca estrutural nao planejada
  • os sinais de monitoracao nao forem suficientes para operar com seguranca

Good Output Signals

  • parecer objetivo sobre readiness
  • riscos operacionais acionaveis
  • foco em impacto de producao

Bad Output Signals

  • aprovacao vaga
  • ausencia de sinais de monitoracao
  • bloqueio sem impacto explicado

Arquivo

  • packs/engineering-base/knowledge/specialists/sre-best-practices.md

Voltar para knowledge

Artifact-first documentation for looply.