Salário: R$ 1.500 a R$ 3.000 por mês

Área: Outros

Nível: Junior

Nossa área de (incluir nome da área)

Buscamos um(a) Especialista SRE para atuar na frente de Run & Ops, com foco em monitoramento e observabilidade, garantindo alta confiabilidade, automação e evolução contínua da operação.

Essa pessoa será peça-chave na transformação do modelo operacional, conduzindo a transição de uma atuação predominantemente reativa para um modelo proativo, automatizado e previsível. Terá como principal objetivo reduzir incidentes, minimizar ruídos operacionais e diminuir a dependência de intervenções manuais, promovendo maior estabilidade, eficiência e maturidade nos processos de operação.

Estamos em busca de um(a) novo(a) piloto para compor nosso time!

Como você vai pilotar com a gente:

Atuar como SRE, garantindo estabilidade, resiliência e confiabilidade dos ambientes produtivos
Estruturar e evoluir monitoramento e observabilidade, com foco em alertas acionáveis, correlação de eventos e redução de ruído.
Integrar alertas técnicos a incidentes funcionais, conectando monitoramento, NOC e processos de ITSM.
Implementar automações e self-healing para tratamento automático de alertas e incidentes conhecidos.
Desenvolver automações e integrações entre ferramentas de monitoramento, ITSM e comunicação.
Criar e manter automações no Slack ou similares, incluindo alertas, escalonamentos e war rooms automáticos.
Analisar recorrência de incidentes, apoiando post-mortems e ações estruturantes.
Atuar de forma integrada com Sustentação, Infraestrutura, NOC e demais áreas Tech.
Apoiar a automatização do NOC, reduzindo atividades manuais e aumentando a eficiência operacional.

Pra largar na frente, você precisa de:

Experiência sólida como SRE, atuando em ambientes produtivos críticos
Forte experiência em monitoramento, alertas e observabilidade, com ferramentas como
Datadog, Zabbix, CloudWatch, Azure Monitor e similares
Grafana, Prometheus
PagerDuty ou similares
Experiência prática na criação, automação e correlação de alertas e incidentes.
Vivência sólida com ITSM (Incidente, Problema e Mudança).
Experiência com automações operacionais (n8n ou ferramentas equivalentes).
Experiência com automações e integrações em Slack ou similares.
Experiência em AWS e Azure.
Experiência com Kubernetes.
Experiência com IaC (Terraform).
Mentalidade forte de automação, confiabilidade e eficiência operacional
Scripting (Python, Shell ou similares).
Ferramentas de ITSM (ex: Jira Service Management).
Práticas de NOC automatizado
Experiência com redução de custos operacionais via automação e confiabilidade.

Diferenciais que turbinarão sua performance:

Perfil proativo e orientado à solução.
Forte senso de dono sobre alertas, incidentes e estabilidade.
Comunicação clara e objetiva, inclusive em cenários críticos.
Capacidade de atuar sob pressão e em ambientes de alta criticidade.

Por que correr com a gente?

Ambiente colaborativo e de alta performance;
Liberdade para criar e testar;
Time apaixonado por tecnologia e desafios;
Crescimento na velocidade máxima.

Aqui, os benefícios são seu combustível para ir mais longe:

Assistência médica (com coparticipação) Porto Seguro - Prata ou Unimed (para colaboradores região do interior de SP);
Assistência odontológica Porto Seguro;
Vale-refeição ou alimentação (R$1.100,00);
Auxílio Mobilidade;
Parceria com TotalPass;
Seguro de vida;
Day off no aniversário
Conexa (Psicologia viva);
Auxílio creche (para filhos com até 5 anos e 11 meses de idade);
Bônus alinhado às metas da companhia;
Vale Bônus de R$250,00 todo mês em nosso app.
Escritório moderno que estimula a criatividade e produtividade com ambientes para lanches, salas de jogos, mesas de bilhar, puffs para relaxar, mercadinho e outras coisas.
E muito mais!

Especialista SRE| Híbrido