* Salário: R$ 11.000 a R$ 20.000 por mês (estimado)
* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.
Área: Tecnologia da Informação
Nível: Senior
A Magalu Cloud é a plataforma de serviços de computação em nuvem criada pela maior e mais inovadora empresa de varejo do país, a Confidencial (Apenas para Cadastrados). Nascemos em 2020, com o propósito claro: Impulsionar a competitividade do Brasil através da tecnologia. Oferecemos serviços de nuvem hyperscale com engenharia local, interface descomplicada, preços em reais abaixo do mercado, suporte em português tornando a nuvem mais acessível a todos.
Estamos construindo uma Plataforma de Observabilidade, responsável por centralizar métricas, logs e traces dos times de produto e disponibilizar SLIs confiáveis para acompanhamento da saúde dos serviços.
Você fará parte do time que sustenta e evolui essa stack em ambiente Cloud/Kubernetes, garantindo que os dados estejam sendo coletados, organizados e disponibilizados corretamente.
Responsabilidades:
- Atuar na sustentação, evolução e otimização da stack de observabilidade.
- Ser referência técnica na gestão, administração e tuning do OpenSearch.
- Garantir a coleta, ingestão, retenção e consulta eficiente de logs em larga escala.
- Definir e implementar boas práticas de indexação, políticas de retenção.
- Atuar de forma proativa em troubleshooting avançado (performance, ingestão, queries e storage).
- Desenhar e evoluir a arquitetura de logs e observabilidade como produto.
- Apoiar e orientar times com a integração da plataforma (logs, métricas e traces).
- Definir padrões, governança e qualidade dos dados de observabilidade.
- Criar e evoluir alertas, thresholds e indicadores (SLIs/SLOs).
- Automatizar processos operacionais e melhorias contínuas da plataforma.
Irá trabalhar diretamente com:
- Prometheus e Mimir (métricas)
- Grafana (dashboards, SLIs e alertas)
- Loki, OpenSearch e Fluent Bit (logs)
- Jaeger (tracing)
Skills Técnicos/Linguagens e scripts:
- Python
- Bash / ShellScript
- YAML
- SQL
- Ansible / Terraform
Conhecimentos essenciais:
- API REST
- JSON
- Arquitetura de microsserviços
- Conceitos avançados de métricas, logs e traces
- Sistemas distribuídos
Conhecimentos avançados esperados:
- Administração e tuning de OpenSearch (clusters, shards, replicas, performance)
- Gestão de índices, gerenciamento do ciclo de vida de indices e retenção de dados
- Otimização de queries e troubleshooting de latência
- Arquitetura de ingestão de logs em alta escala
- Alta disponibilidade e resiliência em ambientes Cloud
Diferenciais:
- Experiência sólida com OpenSearch em produção.
- Vivência em times de plataforma, SRE ou DevOps.
- Experiência com ambientes distribuídos em larga escala.
- Experiência com automação e Infraestrutura como Código (IaC).
Valorizamos também a diversidade e a inclusão em todas as nossas vagas. Aqui na Magalu Cloud, todas as pessoas são bem-vindas – independentemente de gênero, raça, orientação sexual, deficiência ou qualquer outra característica.
Se encaixa no perfil? Venha fazer parte do nosso time!
