* Salário: R$ 12.000 a R$ 20.000 por mês (estimado)

* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.

Área: Engenharia

Nível: Senior

Sobre a Confidencial (Apenas para Cadastrados)

A Confidencial (Apenas para Cadastrados) é uma startup baiana que está transformando a maneira como aposentados, pensionistas, servidores públicos e trabalhadores da iniciativa privada com vínculo CLT acessam, comparam e contratam crédito consignado.

Nosso objetivo é tornar a jornada financeira mais simples, transparente e eficiente, utilizando tecnologia e inteligência artificial para oferecer as melhores opções aos nossos clientes.

Aqui, valorizamos a inovação, o protagonismo e um ambiente colaborativo, onde aprender e crescer faz parte da nossa rotina. Se você quer fazer a diferença e evoluir junto com a gente, a Confidencial (Apenas para Cadastrados) é o lugar certo!

Descrição da vaga

Estamos procurando um(a) Engenheiro(a) de Confiabilidade de Sites (SRE) que se preocupe com a qualidade de engenharia, automação e otimização para se juntar à nossa equipe de Plataforma. Nesta função, você será fundamental para garantir a disponibilidade, escalabilidade e performance de nossos sistemas críticos em produção. Se você adora resolver problemas complexos, automatizar tarefas manuais e aplicar princípios de engenharia de software para construir sistemas mais robustos, esta é a sua chance.

🎯 SEUS DESAFIOS:

Garantir a Confiabilidade: Trabalhar proativamente para garantir a alta disponibilidade, latência mínima e performance de nossos serviços, definindo, medindo e otimizando SLIs (Service Level Indicators) e SLOs (Service Level Objectives).
Redução de Toil: Identificar e automatizar tarefas manuais, repetitivas e operacionais ("toil") através de código e ferramentas, liberando tempo para trabalhos mais estratégicos e preventivos.
Gestão de Incidentes: Participar ativamente da resposta a incidentes, conduzir análises de causa raiz (post-mortems) sem culpa e implementar ações preventivas para evitar recorrências.
Monitoramento e Alerta: Projetar, implementar e manter sistemas avançados de monitoramento, observabilidade e alerta para nossos serviços e infraestrutura.
Automação e Ferramentas: Desenvolver e manter ferramentas, scripts e automações que otimizem o ciclo de vida do software, desde o deployment até a operação.
Infraestrutura como Código (IaC): Contribuir para a gestão da nossa infraestrutura em nuvem (AWS/Azure/GCP) utilizando práticas de Infraestrutura como Código (ie Terraform).
Planejamento de Capacidade: Colaborar no planejamento de capacidade para garantir que nossos sistemas possam escalar para atender à demanda crescente.
Colaboração: Trabalhar em estreita colaboração com as equipes de desenvolvimento de software para influenciar o design de novos recursos, garantindo que sejam construídos com confiabilidade e operabilidade em mente.
Cultura de Aprendizado: Participar de revisões de código, compartilhar conhecimento e contribuir para a melhoria contínua dos nossos processos e sistemas.

📢 ESTAMOS BUSCANDO UMA PESSOA QUE POSSUI:

Experiência em SRE/DevOps: Experiência comprovada em funções de SRE, Engenharia de Confiabilidade, DevOps ou engenharia de sistemas com forte foco em confiabilidade e automação.
Programação/Scripting: Habilidade sólida em pelo menos uma linguagem de programação (ex: Python, Go, Ruby) para automação e desenvolvimento de ferramentas.
Sistemas Distribuídos: Compreensão profunda de arquiteturas de sistemas distribuídos, microserviços e suas particularidades.
Cloud Computing: Experiência prática com plataformas de nuvem (AWS principalmente, GCP) e seus serviços core (EC2/VMs, S3/Storage, RDS/Bancos de Dados, K8s/EKS/ECS/GKE/AKS, Lambdas/Functions, etc.).
Containerização e Orquestração: Familiaridade com tecnologias de containerização (Docker) e orquestração (Kubernetes).
IaC: Experiência com ferramentas de Infraestrutura como Código (Terraform, CloudFormation, Puppet, Chef).
Monitoramento e Observabilidade: Conhecimento e experiência com ferramentas de monitoramento (Prometheus, Grafana, Datadog, New Relic) e sistemas de logging (ELK Stack, Splunk, Loki).
Linux: Forte conhecimento em sistemas operacionais baseados em Linux.
Redes: Entendimento de conceitos de redes (TCP/IP, DNS, HTTP/S, load balancing, firewalls).
Resolução de Problemas: Excelentes habilidades analíticas e de resolução de problemas, com a capacidade de diagnosticar e solucionar issues complexos em ambientes de produção.
Comunicação: Boa comunicação oral e escrita, com capacidade de trabalhar em equipe e colaborar com diferentes stakeholders.

💡 NÃO É REQUISITO MAS PODE SER UM DIFERENCIAL:

Experiência com bancos de dados (SQL e NoSQL) e sistemas de mensageria (Kafka, RabbitMQ).
Conhecimento em metodologias de Chaos Engineering.
Certificações em plataformas de nuvem ou em tecnologias relevantes.
Experiência em ambientes de alta criticidade ou alto tráfego.

➡ NA Confidencial (Apenas para Cadastrados) VOCÊ TEM:

Um ambiente de trabalho desafiador e colaborativo, onde suas ideias são valorizadas.
Oportunidades de crescimento profissional e desenvolvimento de novas habilidades.
Pacote de benefícios com Wellhub e horário flexível.
Cultura que valoriza o aprendizado contínuo e a inovação.
Participação em projetos que realmente fazem a diferença.

Engenheiro SRE