* Salário: R$ 6.000 a R$ 11.000 por mês (estimado)

* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.

Área: Tecnologia da Informação

Nível: Pleno

Sobre a vaga
Buscamos um(a) Cientista de Dados Pleno com forte pegada em Machine Learning para desenvolver e colocar em produção modelos que geram impacto direto no negócio — de previsão de demanda a soluções de NLP e embeddings sobre nosso catálogo e dados comerciais.
Você vai atuar próximo das áreas de negócio e do time de Engenharia de Dados, transformando problemas reais em modelos confiáveis, mensuráveis e em produção. Não é uma vaga só de notebook: esperamos que você acompanhe o ciclo do problema à entrega, com cuidado em validação, métricas e manutenção.

Responsabilidades

Desenvolver, validar e colocar em produção modelos de Machine Learning supervisionados e não-supervisionados (forecasting, classificação, propensão, segmentação).
Construir soluções de NLP e embeddings — por exemplo, matching e enriquecimento de catálogo de produtos por similaridade semântica, classificação e extração a partir de descrições textuais.
Realizar feature engineering e preparação de dados em escala diretamente sobre o data warehouse.
Definir métricas de avaliação adequadas a cada problema, conduzir experimentação rigorosa (baseline, validação, testes) e comunicar resultados de forma clara para áreas técnicas e de negócio.
Acompanhar o desempenho dos modelos em produção e propor melhorias (drift, reentrenamento, otimização).
Colaborar com Engenharia de Dados na construção de pipelines confiáveis e no deploy das soluções.
Documentar premissas, decisões e limitações dos modelos.

Requisitos

Experiência consolidada atuando como Cientista de Dados com entregas reais em produção.
Python sólido para ciência de dados (pandas, NumPy, scikit-learn e similares).
SQL avançado e conforto trabalhando com grandes volumes de dados.
Domínio prático de modelagem de ML: seleção de algoritmos, validação, métricas e diagnóstico de modelos.
Experiência com NLP e/ou embeddings (vetorização de texto, similaridade semântica, modelos de linguagem).
Boas práticas de versionamento (Git) e organização de código.
Pensamento crítico sobre dados: capacidade de questionar premissas, identificar vieses e validar resultados antes de confiar neles.
Boa comunicação — explicar trade-offs e resultados para públicos técnicos e não-técnicos.

Diferenciais

Experiência com Snowflake, especialmente Cortex (funções vetoriais, funções de LLM, Cortex Search).
Vivência com modelos de embeddings multilíngues (ex.: multilingual-e5, bge-m3, BERTimbau) e abordagens híbridas (BM25 + dense).
Familiaridade com o ecossistema Azure e com Power BI / Microsoft Fabric.
Noções de MLOps (versionamento de modelos, monitoramento, CI/CD para ML).
Experiência em forecasting de demanda e séries temporais.
Conhecimento de domínio em bens de consumo (FMCG/CPG) e temas comerciais como Revenue Growth Management, pricing e promoções.