* Salário: R$ 11.000 a R$ 20.000 por mês (estimado)

* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.

Área: Tecnologia da Informação

Nível: Senior

Detalhes da vaga

Qualificações

Jira
Ciência da Computação
Azure
Ansible
DevOps
Certificação AWS
Git
Google Cloud
Banco de Dados
Microservices
Resposta a Incidentes
Docker
Graduação
Melhoria Contínua
Terraform
Continuous integration
Sistemas de Informação
GitHub
Jenkins
Habilidade de Comunicação
Python

Descrição completa da vaga

Estamos em busca de uma pessoa Analista SRE Pleno para integrar nosso time e atuar na sustentação e evolução da nossa infraestrutura e plataformas de produção, garantindo alta disponibilidade, confiabilidade e performance dos serviços.

O que você vai fazer:

Atuar no suporte de segundo nível (N2) em incidentes e requisições relacionadas à infraestrutura do MB e plataformas de Produção, garantindo a disponibilidade e estabilidade dos serviços, com autonomia para conduzir investigações e propor correções
Apoiar na gestão da infraestrutura de produção, diagnosticando e resolvendo problemas para minimizar o tempo de inatividade e garantir a continuidade dos serviços
Executar scripts e operações processuais em ambientes de Produção e não Produtivos, buscando padronização e redução de atividades manuais
Automatizar processos e tarefas repetitivas para melhorar a eficiência operacional e a confiabilidade dos ambientes
Apoiar na manutenção e provisionamento de infraestrutura como código (IaC) utilizando Terraform, contribuindo com melhorias e boas práticas de versionamento
Monitorar sistemas e aplicativos, investigando alertas e logs (incluindo Kubernetes), analisando problemas e implementando soluções
Trabalhar em conjunto com os desenvolvedores e demais times para resolução de problemas e para evoluir sistemas mais resilientes, escaláveis, confiáveis e de alta performance
Participar de análises post-mortem e apoiar a criação de relatórios de incidentes, garantindo acompanhamento das ações e melhoria contínua
Sugerir e implementar melhorias de desempenho, observabilidade e escalabilidade nos serviços e plataformas

O que precisamos que você tenha:

Graduação em Sistemas de Informação, Ciência da Computação, Engenharias e demais cursos da área (ou experiência equivalente)
Experiência prévia em SRE, DevOps ou funções relacionadas a suporte técnico/infraestrutura, com vivência em sustentação de produção e resposta a incidentes
Conhecimento sólido de Linux e Sistemas Operacionais
Conhecimento prático de nuvem pública (GCP, AWS, Azure) e seus principais serviços
Experiência com containers e orquestração (Docker e Kubernetes)
Familiaridade com ferramentas de versionamento como Git e repositórios no GitHub
Conhecimento e experiência em infraestrutura como código (IaC), com Terraform (e noções de boas práticas de manutenção/evolução)
Proficiência em scripts de automação (Python, Bash, etc.)
Familiaridade com ferramentas de CI/CD (Jenkins, Github Actions, etc.)
Organização e boa comunicação para lidar com chamados, priorização de demandas via Jira e interagir com times de desenvolvimento
Habilidades de resolução de problemas e pensamento crítico

Diferenciais:

Experiência prévia com ambientes de produção em nuvem, especialmente GCP (Google Cloud Platform)
Conhecimento e experiência com monitoramento e observabilidade (ex: Prometheus, Grafana, Stackdriver)
Noções de segurança em cloud, controle de acesso e gestão de identidades
Vivência com práticas de SRE e cultura DevOps
Conhecimento e experiência em ferramentas complementares de IaC/automação (Ansible e/ou Terragrunt)
Certificações GCP, Kubernetes ou Terraform (ou SRE/DevOps/Cloud Providers)
Experiência com bancos de dados e desenvolvimento de microsserviços