* Salário: R$ 3.000 a R$ 6.000 por mês (estimado)
* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.
Área: Tecnologia da Informação
Nível: Junior
TECNOLOGIA – SÃO PAULO / SP
Sobre a vaga:
Estamos buscando um(a) Engenheiro(a) de Dados/ML Sênior para liderar a arquitetura, desenvolvimento e governança da nossa nova Feature Store. O objetivo central é construir um framework robusto, modular e descentralizado que resolva as dores dos Cientistas de Dados, acelerando o ciclo de colocar modelos em produção com segurança e qualidade. Se você possui mentalidade data-as-a-product, domina soluções modulares em Databricks e quer ser a ponte entre a engenharia estruturada e a ciência de dados, essa oportunidade é para você.
Responsabilidades:
- Desenvolvimento de Framework Core: Criar componentes modulares e reutilizáveis (Writer, Data Quality, Feature Functions), evitando códigos complexos e desestruturados.
- Garantia de Qualidade e Auditoria: Implementar motores de validação (Data Quality) com ferramentas como Great Expectations ou Delta Expectations (lógica de Gatekeeper).
- Modelagem e Persistência Histórica: Desenvolver lógicas avançadas de persistência (SCD Tipo 2 e Tipo 4), garantindo consistência temporal completa (Point-in-Time Correctness).
- Governança e Linhagem: Estruturar o registro de metadados no Unity Catalog e garantir rastreabilidade total integrando com MLflow.
- Orquestração e DevOps de Dados: Configurar pipelines complexos e atômicos no Databricks, gerenciando ambientes (Dev/Prod) e versionamento.
- Foco no Usuário (Discovery & UX): Alinhar escopos com Cientistas de Dados para garantir que a usabilidade da Feature Store atenda às necessidades de negócio.
- Disseminação de Conhecimento: Liderar a migração de projetos piloto, criar documentações Self-Service e ministrar workshops práticos para o time.
Requisitos:
- Experiência sólida como Engenheiro(a) de Dados Sênior ou Engenheiro(a) de Machine Learning.
- Domínio avançado do ecossistema Databricks (Unity Catalog, Delta Tables, Workflows/Jobs).
- Fortes conhecimentos em frameworks de validação de dados e MLflow.
- Experiência prática com estratégias de versionamento de dados e histórico (SCD).
- Proficiência em Python voltado para desenvolvimento de pacotes, classes reutilizáveis e testes unitários.
- Sólido conhecimento em conceitos de governança (Metadados, Catálogo, Linhagem).
- Perfil Soft Skill: Foco na experiência do usuário (empatia com a dor do cientista), comunicação didática para treinamentos e alta autonomia na resolução de problemas.
Diferenciais:
- Experiência prévia na implementação de Feature Stores do zero (ex: Feast, Databricks Feature Store).
- Familiaridade com taxonomias de transformações complexas (MIT, MDT, ODT).
- Conhecimento da metodologia/lógica de negócio modular E-A-C-TIM.
Informações adicionais
- Localização: São Paulo – SP;
- Modelo de trabalho 100% home office.
Se interessou pela vaga? envie seu currículo atualizado para: [email protected] com a pretensão salarial e mencionando no título “AI Machine Learning – Databricks”.
