* Salário: R$ 2.000 a R$ 5.000 por mês (estimado)
* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.
Área: Outros
Nível: Senior
Suport SRE Senior
Home Office
Objetivo da vaga
Atuar como referência técnica em SRE, apoiando a evolução da confiabilidade, disponibilidade e escalabilidade dos ambientes, além de estruturar processos, governança e boas práticas operacionais, trabalhando de forma integrada com times de desenvolvimento, infraestrutura e negócio.
Principais responsabilidades
Confiabilidade e operação
Garantir alta disponibilidade, estabilidade e performance dos sistemas
Definir, acompanhar e evoluir SLIs, SLOs e SLAs
Atuar em incidentes críticos, liderando análises de causa raiz (RCA) e pós-mortems
Propor melhorias contínuas para redução de falhas recorrentes
Monitoramento e observabilidade
Estruturar e manter soluções de monitoramento, alertas e dashboards
Definir padrões de observabilidade (logs, métricas e traces)
Evoluir práticas de gestão de incidentes e alertas (redução de ruído)
Automação e engenharia
Automatizar processos operacionais (deploy, rollback, escalabilidade, rotinas)
Atuar com infraestrutura como código
Apoiar e evoluir pipelines de CI/CD com foco em confiabilidade
Cloud, containers e infraestrutura
Atuar em ambientes Cloud (AWS, Azure ou GCP)
Administrar e apoiar ambientes Kubernetes
Apoiar decisões de arquitetura com foco em resiliência, custo e escala
Processos e governança
Definir e evoluir processos operacionais e de governança
Apoiar a definição de políticas, padrões e boas práticas de SRE
Atuar na definição e acompanhamento de SLAs com áreas internas e clientes
Apoiar auditorias, controles e padronizações técnicas
Atuação transversal
Trabalhar de forma colaborativa com times de Dev, Infra, Segurança e Produto
Atuar como mentor técnico, apoiando o crescimento do time
Traduzir riscos técnicos em impacto de negócio
Requisitos técnicos
Experiência sólida em SRE, DevOps ou Operações de ambientes críticos
Forte conhecimento em:
Cloud (AWS, Azure ou GCP)
Kubernetes e containers
Linux e redes
Monitoramento e observabilidade (Dynatrace, Grafana, Datadog, New realic, Zabbix)
Experiência com automação e infraestrutura como código
Vivência com gestão de incidentes e ambientes produtivos
Experiência na definição de SLIs, SLOs e SLAs
Requisitos comportamentais
Perfil analítico e orientado a solução
Boa comunicação e capacidade de articulação entre áreas
Visão sistêmica e foco em melhoria contínua
Capacidade de atuar tanto no hands-on quanto no estratégico
Postura de dono(a) do ambiente
