* Salário: R$ 11.000 a R$ 20.000 por mês (estimado)

* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.

Área: Tecnologia da Informação

Nível: Senior

Estamos em busca de um(a) profissional para atuar como Site Reliability Engineer (SRE) Pleno/Sênior, sendo responsável por garantir a confiabilidade, escalabilidade e performance de plataformas distribuídas em ambientes multi-cloud.Essa pessoa terá papel estratégico não apenas na operação, mas também na evolução da maturidade de SRE, influenciando decisões arquiteturais, promovendo automação e elevando os padrões de observabilidade e resiliência dos sistemas. Atuará de forma próxima aos times de engenharia, com forte protagonismo técnico e visão sistêmica.

Responsabilidades:

– Projetar, operar e evoluir plataformas baseadas em Kubernetes em múltiplos provedores (AKS, EKS e GKE).

– Liderar e evoluir práticas de GitOps utilizando ferramentas como Argo CD, garantindo governança e rastreabilidade.

– Desenvolver e aprimorar a observabilidade ponta a ponta (métricas, logs, tracing e APM com Dynatrace e Grafana).

– Atuar na otimização de performance global e entrega de conteúdo utilizando CDN (Akamai ou similares).

– Projetar, implementar e evoluir pipelines de CI/CD com Azure DevOps ou ferramentas equivalentes.

– Administrar e otimizar bancos de dados MongoDB e PostgreSQL.

– Realizar troubleshooting avançado em sistemas distribuídos, incluindo análise de código, comportamento em runtime e dependências externas.

– Conduzir processos de gestão de incidentes (on-call, post-mortem sem culpabilização, análise de causa raiz e ações preventivas).

– Definir, evoluir e disseminar práticas de confiabilidade como SLIs, SLOs, SLAs e error budgets.

Requisitos:

– Experiência sólida com Kubernetes em ambiente produtivo (deploy, scaling, segurança e troubleshooting).

– Vivência prática em ambientes multi-cloud (AWS, Azure e GCP).

– Conhecimento em observabilidade (métricas, logs, tracing e APM).

– Experiência com pipelines de CI/CD e automação de deploy.

– Experiência com bancos de dados MongoDB e PostgreSQL.

– Conhecimento em CDN e otimização de performance.

– Capacidade de troubleshooting em aplicações (.NET, Python, Java e/ou Node.js).

– Sólidos conhecimentos em Linux, redes (HTTP, DNS, TLS) e containers (Docker).

– Experiência com Infraestrutura como Código (Terraform ou similar).

Diferenciais:

– Experiência em ambientes de alta escala e missão crítica.

– Vivência com arquiteturas resilientes e distribuídas.

– Conhecimento em caching e estratégias de performance.

– Experiência com CDN tuning (Akamai ou similares).

– Experiência com tuning de banco de dados (queries, índices e performance).

– Conhecimento em práticas de FinOps (otimização de custos em cloud).

– Experiência com estratégia multi-cloud (AKS, EKS e GKE).

– Atuação prévia como referência técnica ou mentor(a) de outros engenheiros.

Perfil desejado:

– Mentalidade orientada à confiabilidade, automação e escala.

– Forte senso de ownership e responsabilidade por sistemas críticos.

– Capacidade de atuar com alto nível de autonomia.

– Perfil analítico para resolução de problemas complexos.

– Comunicação clara e colaboração com times multidisciplinares.

– Proatividade na identificação e mitigação de riscos.

– Cultura de melhoria contínua e aprendizado constante.

Informações importantes:

Modelo de Trabalho: Home Office

Horário: Segunda a sexta – 09h00 às 18h00.

Forma de contratação: PJ.

Idioma: Inglês - Técnico.

Analista SRE Sênior - 26387