* Salário: R$ 11.000 a R$ 20.000 por mês (estimado)

* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.

Área: Tecnologia da Informação

Nível: Senior

Somos inspired by tech powered by people. Por isso, precisamos de pessoas apaixonados por desafios e com sede de aprendizado contínuo.

Buscamos por novos makers para sonharem com a gente, que enxerguem além do óbvio e que estejam prontos para se juntar a nós nessa jornada de transformação e crescimento. Estamos expandindo nossos horizontes e buscamos pessoas que compartilhem dessa mesma paixão pela tecnologia e pelo aprendizado contínuo. Se você se encaixa nesse perfil, venha fazer parte do nosso time!

RESPONSABILIDADES E ATRIBUIÇÕES

Criar e manter pipelines de dados em Python, com possibilidade de utilização de PySpark para processamento distribuído e grandes volumes de dados;
Realizar deploy de aplicações e pipelines na Google Cloud Platform (GCP) utilizando Docker, garantindo versionamento, portabilidade e padronização dos ambientes;
Orquestrar pipelines de dados utilizando Apache Airflow, assegurando agendamento, dependências, reprocessamentos, monitoramento e confiabilidade operacional;
Atuar no provisionamento e gestão de infraestrutura na GCP via Terraform, aplicando conceitos de Infraestrutura como Código (IaC) e boas práticas de segurança e governança;
Apoiar a criação e evolução de dashboards e camadas analíticas em Tableau e Power BI, garantindo consistência, qualidade e aderência às métricas de negócio;
Apoiar a construção e evolução de modelos de IA e Machine Learning, utilizando Scikit-learn e Hugging Face, em conjunto com times de dados e negócio;
Atuar na governança da Plataforma de Dados, garantindo conformidade com a LGPD, incluindo classificação de dados, controle de acesso, rastreabilidade e boas práticas de segurança;
Desenvolver código seguindo boas práticas de engenharia de software, com conhecimento em CI/CD, TDD, versionamento e revisão de código;
Desenvolver e otimizar scripts SQL para tratamento e transformação de dados em múltiplas camadas (ex.: staging, bronze/silver/gold, core/marts);
Contribuir na modelagem de dados e definição da arquitetura de soluções, apoiando decisões técnicas, padrões e evolução da plataforma.

REQUISITOS E QUALIFICAÇÕES

Experiência sólida com Python para engenharia de dados;
Experiência com SQL para transformação, modelagem e otimização de dados;
Conhecimento ou experiência prática com PySpark;
Experiência com GCP (ex.: BigQuery, Cloud Storage, Cloud Run, Composer, entre outros);
Experiência com Docker e conceitos de conteinerização;
Experiência com Apache Airflow para orquestração de pipelines;
Experiência com Terraform ou outras ferramentas de Infraestrutura como Código;
Conhecimento em modelagem de dados e arquitetura de soluções analíticas;
Conhecimento em boas práticas de engenharia, CI/CD e versionamento (Git).

Diferenciais

Experiência com Tableau e/ou Power BI;
Conhecimentos de Machine Learning e bibliotecas como Scikit-learn e Hugging Face;
Vivência em ambientes com governança de dados e LGPD;
Experiência em arquiteturas de dados modernas (Data Lake, Lakehouse, Data Mesh);
Atuação em ambientes ágeis e times multidisciplinares.

Pessoa Engenheira de Dados Sênior