Compartilhando conhecimento através de Runops em um time com incidentes recorrentes

Como implementar um processo de Runops auxiliou o time a diminuir a pressão com relação aos incidentes recorrentes no time?

Pedro correia
2 min readSep 17, 2021

Em alguns momentos observar-se squads que possuem grande responsabilidade como manutenções de serviços já existente, entrega de features e resolução de incidentes, que em muitos casos a quantidade de incidentes recorrentes e débitos técnicos sobrecarregam o time, diminuindo a produtividade do time, aumentando o nível de estresse e cobrança por parte de stakeholders. Para somar vemos que poucas pessoas sabem como resolver esses incidentes recorrentes, indicando que a quantidade de “know how” não está difundida por todos da equipe, essas pessoas muitas vezes sabem o que deve ser realizado para resolver os problemas na sua causa raiz, o que não acontece devido à sobrecarga de incidentes recorrente.

Com essa situação que algumas equipes podem passar existe uma abordagem que pode ser utilizada de modo a diminui o gap de conhecimento na equipe, a seguir um video explicativo sobre Runbook e como ele pode ser aplicado no seu dia a dia profissional.

Exemplo de runbook

Dado conceito “Os runbooks de operações, geralmente chamados simplesmente de runbooks, são um conjunto de documentos, referências e procedimentos padronizados usados para descrever tarefas comuns de TI”. Podendo ser utilizado para processos de resolução de incidentes em um time, assim, pode ser criado um local para armazenar esses conhecimentos.

A seguir você pode clonar a base de conhecimento para aplicar na sua equipe.

https://www.notion.so/Runbook-c9c41de0e1f14b16b101976ef3275e28.

Quais os benefícios que tivemos utilizando essa abordagem?

  1. Criando essa base de informações, foi possível auxiliar as pessoas com baixo nível de conhecimento a diminuírem o tempo de ramp up;
  2. Pudemos diminuir o estresse gerado no time, deixando que uma pessoa fosse responsável apenas para resolver issues recorrentes (mapeadas no runbook) enquanto outra pudesse trabalhar focado em diminuir os incidentes na causa raiz;

--

--