Salário: R$ 1.500 a R$ 3.000 por mês
Área: Outros
Nível: Junior
Nossa área de (incluir nome da área)
Buscamos um(a) Especialista SRE para atuar na frente de Run & Ops, com foco em monitoramento e observabilidade, garantindo alta confiabilidade, automação e evolução contínua da operação.
Essa pessoa será peça-chave na transformação do modelo operacional, conduzindo a transição de uma atuação predominantemente reativa para um modelo proativo, automatizado e previsível. Terá como principal objetivo reduzir incidentes, minimizar ruídos operacionais e diminuir a dependência de intervenções manuais, promovendo maior estabilidade, eficiência e maturidade nos processos de operação.
Estamos em busca de um(a) novo(a) piloto para compor nosso time!
Como você vai pilotar com a gente:
- Atuar como SRE, garantindo estabilidade, resiliência e confiabilidade dos ambientes produtivos
- Estruturar e evoluir monitoramento e observabilidade, com foco em alertas acionáveis, correlação de eventos e redução de ruído.
- Integrar alertas técnicos a incidentes funcionais, conectando monitoramento, NOC e processos de ITSM.
- Implementar automações e self-healing para tratamento automático de alertas e incidentes conhecidos.
- Desenvolver automações e integrações entre ferramentas de monitoramento, ITSM e comunicação.
- Criar e manter automações no Slack ou similares, incluindo alertas, escalonamentos e war rooms automáticos.
- Analisar recorrência de incidentes, apoiando post-mortems e ações estruturantes.
- Atuar de forma integrada com Sustentação, Infraestrutura, NOC e demais áreas Tech.
- Apoiar a automatização do NOC, reduzindo atividades manuais e aumentando a eficiência operacional.
Pra largar na frente, você precisa de:
- Experiência sólida como SRE, atuando em ambientes produtivos críticos
- Forte experiência em monitoramento, alertas e observabilidade, com ferramentas como
- Datadog, Zabbix, CloudWatch, Azure Monitor e similares
- Grafana, Prometheus
- PagerDuty ou similares
- Experiência prática na criação, automação e correlação de alertas e incidentes.
- Vivência sólida com ITSM (Incidente, Problema e Mudança).
- Experiência com automações operacionais (n8n ou ferramentas equivalentes).
- Experiência com automações e integrações em Slack ou similares.
- Experiência em AWS e Azure.
- Experiência com Kubernetes.
- Experiência com IaC (Terraform).
- Mentalidade forte de automação, confiabilidade e eficiência operacional
- Scripting (Python, Shell ou similares).
- Ferramentas de ITSM (ex: Jira Service Management).
- Práticas de NOC automatizado
- Experiência com redução de custos operacionais via automação e confiabilidade.
Diferenciais que turbinarão sua performance:
- Perfil proativo e orientado à solução.
- Forte senso de dono sobre alertas, incidentes e estabilidade.
- Comunicação clara e objetiva, inclusive em cenários críticos.
- Capacidade de atuar sob pressão e em ambientes de alta criticidade.
Por que correr com a gente?
- Ambiente colaborativo e de alta performance;
- Liberdade para criar e testar;
- Time apaixonado por tecnologia e desafios;
- Crescimento na velocidade máxima.
Aqui, os benefícios são seu combustível para ir mais longe:
- Assistência médica (com coparticipação) Porto Seguro - Prata ou Unimed (para colaboradores região do interior de SP);
- Assistência odontológica Porto Seguro;
- Vale-refeição ou alimentação (R$1.100,00);
- Auxílio Mobilidade;
- Parceria com TotalPass;
- Seguro de vida;
- Day off no aniversário
- Conexa (Psicologia viva);
- Auxílio creche (para filhos com até 5 anos e 11 meses de idade);
- Bônus alinhado às metas da companhia;
- Vale Bônus de R$250,00 todo mês em nosso app.
- Escritório moderno que estimula a criatividade e produtividade com ambientes para lanches, salas de jogos, mesas de bilhar, puffs para relaxar, mercadinho e outras coisas.
- E muito mais!
