Caro usuário, habilite o javascript para que esse site funcione corretamente.

Pessoa Engenheira de Dados Sênior

* Salário: R$ 11.000 a R$ 20.000 por mês (estimado)

* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.

Área: Tecnologia da Informação

Nível: Senior

Somos inspired by tech powered by people. Por isso, precisamos de pessoas apaixonados por desafios e com sede de aprendizado contínuo.

Buscamos por novos makers para sonharem com a gente, que enxerguem além do óbvio e que estejam prontos para se juntar a nós nessa jornada de transformação e crescimento. Estamos expandindo nossos horizontes e buscamos pessoas que compartilhem dessa mesma paixão pela tecnologia e pelo aprendizado contínuo. Se você se encaixa nesse perfil, venha fazer parte do nosso time!

RESPONSABILIDADES E ATRIBUIÇÕES

  • Criar e manter pipelines de dados em Python, com possibilidade de utilização de PySpark para processamento distribuído e grandes volumes de dados;
  • Realizar deploy de aplicações e pipelines na Google Cloud Platform (GCP) utilizando Docker, garantindo versionamento, portabilidade e padronização dos ambientes;
  • Orquestrar pipelines de dados utilizando Apache Airflow, assegurando agendamento, dependências, reprocessamentos, monitoramento e confiabilidade operacional;
  • Atuar no provisionamento e gestão de infraestrutura na GCP via Terraform, aplicando conceitos de Infraestrutura como Código (IaC) e boas práticas de segurança e governança;
  • Apoiar a criação e evolução de dashboards e camadas analíticas em Tableau e Power BI, garantindo consistência, qualidade e aderência às métricas de negócio;
  • Apoiar a construção e evolução de modelos de IA e Machine Learning, utilizando Scikit-learn e Hugging Face, em conjunto com times de dados e negócio;
  • Atuar na governança da Plataforma de Dados, garantindo conformidade com a LGPD, incluindo classificação de dados, controle de acesso, rastreabilidade e boas práticas de segurança;
  • Desenvolver código seguindo boas práticas de engenharia de software, com conhecimento em CI/CD, TDD, versionamento e revisão de código;
  • Desenvolver e otimizar scripts SQL para tratamento e transformação de dados em múltiplas camadas (ex.: staging, bronze/silver/gold, core/marts);
  • Contribuir na modelagem de dados e definição da arquitetura de soluções, apoiando decisões técnicas, padrões e evolução da plataforma.

REQUISITOS E QUALIFICAÇÕES

  • Experiência sólida com Python para engenharia de dados;
  • Experiência com SQL para transformação, modelagem e otimização de dados;
  • Conhecimento ou experiência prática com PySpark;
  • Experiência com GCP (ex.: BigQuery, Cloud Storage, Cloud Run, Composer, entre outros);
  • Experiência com Docker e conceitos de conteinerização;
  • Experiência com Apache Airflow para orquestração de pipelines;
  • Experiência com Terraform ou outras ferramentas de Infraestrutura como Código;
  • Conhecimento em modelagem de dados e arquitetura de soluções analíticas;
  • Conhecimento em boas práticas de engenharia, CI/CD e versionamento (Git).

Diferenciais

  • Experiência com Tableau e/ou Power BI;
  • Conhecimentos de Machine Learning e bibliotecas como Scikit-learn e Hugging Face;
  • Vivência em ambientes com governança de dados e LGPD;
  • Experiência em arquiteturas de dados modernas (Data Lake, Lakehouse, Data Mesh);
  • Atuação em ambientes ágeis e times multidisciplinares.