Caro usuário, habilite o javascript para que esse site funcione corretamente.

Analista de Infraestrutura Sênior - Plataforma de Observabilidade

* Salário: R$ 11.000 a R$ 20.000 por mês (estimado)

* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.

Área: Tecnologia da Informação

Nível: Senior

A Magalu Cloud é a plataforma de serviços de computação em nuvem criada pela maior e mais inovadora empresa de varejo do país, a Confidencial (Apenas para Cadastrados). Nascemos em 2020, com o propósito claro: Impulsionar a competitividade do Brasil através da tecnologia. Oferecemos serviços de nuvem hyperscale com engenharia local, interface descomplicada, preços em reais abaixo do mercado, suporte em português tornando a nuvem mais acessível a todos.

Estamos construindo uma Plataforma de Observabilidade, responsável por centralizar métricas, logs e traces dos times de produto e disponibilizar SLIs confiáveis para acompanhamento da saúde dos serviços.
Você fará parte do time que sustenta e evolui essa stack em ambiente Cloud/Kubernetes, garantindo que os dados estejam sendo coletados, organizados e disponibilizados corretamente.

Responsabilidades:

  • Atuar na sustentação, evolução e otimização da stack de observabilidade.
  • Ser referência técnica na gestão, administração e tuning do OpenSearch.
  • Garantir a coleta, ingestão, retenção e consulta eficiente de logs em larga escala.
  • Definir e implementar boas práticas de indexação, políticas de retenção.
  • Atuar de forma proativa em troubleshooting avançado (performance, ingestão, queries e storage).
  • Desenhar e evoluir a arquitetura de logs e observabilidade como produto.
  • Apoiar e orientar times com a integração da plataforma (logs, métricas e traces).
  • Definir padrões, governança e qualidade dos dados de observabilidade.
  • Criar e evoluir alertas, thresholds e indicadores (SLIs/SLOs).
  • Automatizar processos operacionais e melhorias contínuas da plataforma.


Irá trabalhar diretamente com:

  • Prometheus e Mimir (métricas)
  • Grafana (dashboards, SLIs e alertas)
  • Loki, OpenSearch e Fluent Bit (logs)
  • Jaeger (tracing)


Skills Técnicos/Linguagens e scripts:

  • Python
  • Bash / ShellScript
  • YAML
  • SQL
  • Ansible / Terraform


Conhecimentos essenciais:

  • API REST
  • JSON
  • Arquitetura de microsserviços
  • Conceitos avançados de métricas, logs e traces
  • Sistemas distribuídos


Conhecimentos avançados esperados:

  • Administração e tuning de OpenSearch (clusters, shards, replicas, performance)
  • Gestão de índices, gerenciamento do ciclo de vida de indices e retenção de dados
  • Otimização de queries e troubleshooting de latência
  • Arquitetura de ingestão de logs em alta escala
  • Alta disponibilidade e resiliência em ambientes Cloud


Diferenciais:

  • Experiência sólida com OpenSearch em produção.
  • Vivência em times de plataforma, SRE ou DevOps.
  • Experiência com ambientes distribuídos em larga escala.
  • Experiência com automação e Infraestrutura como Código (IaC).
Aqui na Magalu Cloud, acreditamos em pessoas que constroem junto e promovem um ambiente de aprendizado e inovação constante. Se você se identifica com esse perfil, queremos te conhecer! Valorizamos autonomia, responsabilidade e entregas ágeis, com um ambiente colaborativo e sem burocracia. Nosso ritmo é acelerado, mas equilibramos qualidade e planejamento.

Valorizamos também a diversidade e a inclusão em todas as nossas vagas. Aqui na Magalu Cloud, todas as pessoas são bem-vindas – independentemente de gênero, raça, orientação sexual, deficiência ou qualquer outra característica.

Se encaixa no perfil? Venha fazer parte do nosso time!