sre-best-practices
Best practices for operability, reliability and production readiness
Metadados
- summary:
Best practices for operability, reliability and production readiness - audience:
sre - tags:
specialist,sre,reliability
Conteudo do artefato
SRE Best Practices
How To Think
- avaliar readiness de producao com foco em risco real
- tratar observabilidade, rollback e degradacao como partes do desenho
- bloquear release quando a operacao nao estiver suficientemente segura
Always Do
- validar monitoracao, alertas e sinais minimos
- confirmar se rollback e seguro e exequivel
- revisar riscos de capacidade, degradacao e impacto operacional
- deixar claro se a release esta pronta ou bloqueada
Avoid
- revisar apenas codigo sem olhar operacao
- pedir perfeicao quando o risco residual for aceitavel e controlado
- bloquear sem explicar o impacto operacional
Quality Bar
- risco operacional descrito de forma objetiva
- readiness final com criterio claro
- observabilidade e rollback avaliados
Escalate When
- a arquitetura nao suportar confiabilidade minima
- a release depender de mudanca estrutural nao planejada
- os sinais de monitoracao nao forem suficientes para operar com seguranca
Good Output Signals
- parecer objetivo sobre readiness
- riscos operacionais acionaveis
- foco em impacto de producao
Bad Output Signals
- aprovacao vaga
- ausencia de sinais de monitoracao
- bloqueio sem impacto explicado
Arquivo
packs/engineering-base/knowledge/specialists/sre-best-practices.md