* Salário: R$ 11.000 a R$ 20.000 por mês (estimado)
* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.
Área: Tecnologia da Informação
Nível: Senior
Estamos em busca de um(a) profissional para atuar como Site Reliability Engineer (SRE) Pleno/Sênior, sendo responsável por garantir a confiabilidade, escalabilidade e performance de plataformas distribuídas em ambientes multi-cloud.Essa pessoa terá papel estratégico não apenas na operação, mas também na evolução da maturidade de SRE, influenciando decisões arquiteturais, promovendo automação e elevando os padrões de observabilidade e resiliência dos sistemas. Atuará de forma próxima aos times de engenharia, com forte protagonismo técnico e visão sistêmica.
Responsabilidades:
– Projetar, operar e evoluir plataformas baseadas em Kubernetes em múltiplos provedores (AKS, EKS e GKE).
– Liderar e evoluir práticas de GitOps utilizando ferramentas como Argo CD, garantindo governança e rastreabilidade.
– Desenvolver e aprimorar a observabilidade ponta a ponta (métricas, logs, tracing e APM com Dynatrace e Grafana).
– Atuar na otimização de performance global e entrega de conteúdo utilizando CDN (Akamai ou similares).
– Projetar, implementar e evoluir pipelines de CI/CD com Azure DevOps ou ferramentas equivalentes.
– Administrar e otimizar bancos de dados MongoDB e PostgreSQL.
– Realizar troubleshooting avançado em sistemas distribuídos, incluindo análise de código, comportamento em runtime e dependências externas.
– Conduzir processos de gestão de incidentes (on-call, post-mortem sem culpabilização, análise de causa raiz e ações preventivas).
– Definir, evoluir e disseminar práticas de confiabilidade como SLIs, SLOs, SLAs e error budgets.
Requisitos:
– Experiência sólida com Kubernetes em ambiente produtivo (deploy, scaling, segurança e troubleshooting).
– Vivência prática em ambientes multi-cloud (AWS, Azure e GCP).
– Conhecimento em observabilidade (métricas, logs, tracing e APM).
– Experiência com pipelines de CI/CD e automação de deploy.
– Experiência com bancos de dados MongoDB e PostgreSQL.
– Conhecimento em CDN e otimização de performance.
– Capacidade de troubleshooting em aplicações (.NET, Python, Java e/ou Node.js).
– Sólidos conhecimentos em Linux, redes (HTTP, DNS, TLS) e containers (Docker).
– Experiência com Infraestrutura como Código (Terraform ou similar).
Diferenciais:
– Experiência em ambientes de alta escala e missão crítica.
– Vivência com arquiteturas resilientes e distribuídas.
– Conhecimento em caching e estratégias de performance.
– Experiência com CDN tuning (Akamai ou similares).
– Experiência com tuning de banco de dados (queries, índices e performance).
– Conhecimento em práticas de FinOps (otimização de custos em cloud).
– Experiência com estratégia multi-cloud (AKS, EKS e GKE).
– Atuação prévia como referência técnica ou mentor(a) de outros engenheiros.
Perfil desejado:
– Mentalidade orientada à confiabilidade, automação e escala.
– Forte senso de ownership e responsabilidade por sistemas críticos.
– Capacidade de atuar com alto nível de autonomia.
– Perfil analítico para resolução de problemas complexos.
– Comunicação clara e colaboração com times multidisciplinares.
– Proatividade na identificação e mitigação de riscos.
– Cultura de melhoria contínua e aprendizado constante.
Informações importantes:
Modelo de Trabalho: Home Office
Horário: Segunda a sexta – 09h00 às 18h00.
Forma de contratação: PJ.
Idioma: Inglês - Técnico.
