Job Description
Estamos em busca de um(a) profissional para atuar como Site Reliability Engineer (SRE), sendo responsável por garantir a confiabilidade, disponibilidade e escalabilidade de sistemas críticos em ambiente cloud AWS, com forte atuação em automação, observabilidade e operação de ambientes Kubernetes.
Essa pessoa atuará na sustentação e evolução de plataformas em produção, garantindo o cumprimento de SLAs, apoiando na redução de incidentes e MTTR, além de promover melhorias contínuas em performance, segurança e eficiência de custos. Atuará em conjunto com times de engenharia e operações, contribuindo para a maturidade de SRE na organização.
Responsabilidades:
Garantir os SLAs, SLOs e SLIs definidos para serviços críticos.
Implementar e evoluir monitoramento e alertas proativos.
Atuar na automação de processos de deploy, escalabilidade e operação.
Realizar troubleshooting e análise de incidentes em ambientes produtivos.
Conduzir post-mo...
Apply for this Job
Submit your application for the Analista sre sênior - 26425 position at Grupo Taking.
Apply Now Save for Later