Caro usuário, habilite o javascript para que esse site funcione corretamente.

Cientista de Dados Sênior

* Salário: R$ 11.000 a R$ 20.000 por mês (estimado)

* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.

Área: Tecnologia da Informação

Nível: Senior

A Leega é uma empresa focada no atendimento eficiente e inovador em seus clientes.

Isso não poderia ser diferente com o nosso principal combustível: as pessoas!

Nossa cultura é inspiradora e nossos valores estão presentes no dia a dia: ética e transparência, excelência de qualidade, trabalho em equipe, responsabilidade econômica, social e ambiental, relações humanas e credibilidade.

Buscamos profissionais inovadores que sejam movidos por desafios e focados em resultados.

Se você busca uma empresa dinâmica e parceira e que investe em seus colaboradores através de capacitação constante, a Leega é o lugar para você!

>> A LEEGA É PARA TODOS, ficaremos muito felizes em ter você em nosso time. Venha fazer parte da nossa história e da construção do nosso futuro.

Cadastre-se agora mesmo em nossas vagas!

Responsabilidades e atribuições

Sobre a oportunidade

Você vai transformar dados de demanda, ocupação e comportamento de compra em modelos que precificam uma malha com milhares de pares origem-destino e rotas multi trecho — um problema de revenue management cientificamente rico, com inventário perecível de assentos, sazonalidade forte, no-show e tetos regulatórios. É um papel centrado na descoberta: formular hipóteses, validá-las com rigor estatístico e mover receita e margem na escala de milhões de viagens por ano.


Seus Desafios

Investigação e EDA — conduzir análise exploratória e estatística para descobrir padrões, levantar hipóteses e guiar a modelagem.

Previsão de demanda — modelar demanda e no-show por par origem-destino com gradient boosting e séries temporais, corrigindo o viés de demanda censurada (unconstrained demand).

Elasticidade e disposição a pagar — estimar elasticidade-preço e willingness-to-pay por segmento e rota, base para a otimização de preço.

Revenue management em rede — modelar proteção de assentos e alocação de capacidade (fare buckets) em rotas multi-trecho, equilibrando ocupação e receita.

Experimentação causal — desenhar testes A/B e inferência causal que validam mudanças de preço e medem uplift real, com critérios estatísticos claros de promoção.

Explicabilidade e confiança — garantir interpretabilidade (ex.: SHAP) para defender cada preço perante o negócio e o regulador.

Cold start e calibração — desenhar estratégias para rotas com pouco histórico, partindo de priors de literatura e evoluindo para ML, por tenant.

Você é a ponte entre ciência e produto: colabora com ML engineers no caminho até produção, com data engineers na disponibilidade dos dados, e com as áreas comercial e de operações na definição das metas.



Requisitos e qualificações

Stack & Ferramentas

  • Linguagem & libs: Python (pandas, NumPy, scikit-learn, statsmodels), XGBoost, LightGBM
  • Estatística & ML clássico: EDA, modelos estatísticos, regressão, classificação, clustering
  • Deep learning: PyTorch, TensorFlow
  • Causal & temporal: séries temporais/forecasting, inferência causal (ex.: EconML, DoWhy), bayesiano/hierárquico
  • Revenue management & otimização: elasticidade, fare buckets / seat protection, programação linear
  • Experimentação, MLOps & dados: A/B testing, JupyterHub, MLflow, Ray Tune; SHAP, SQL, Cube.js sobre Athena

O que Buscamos

Essenciais

• Formação quantitativa sólida (Estatística, Economia, Matemática, Engenharia, CC ou afim) e base robusta em probabilidade, inferência e desenho experimental. • Análise exploratória de dados (EDA) e forte capacidade de storytelling e visualização.

• ML clássico (regressão, classificação, clustering) e séries temporais; familiaridade com deep learning (PyTorch ou TensorFlow).

• Python e o ecossistema de Data Science (pandas, scikit-learn, statsmodels); SQL para dados em larga escala.

• Inferência causal e/ou testes A/B e medição de impacto.

• Comunicação científica clara e conforto com desenvolvimento assistido por IA (Claude Code).


Diferenciais

• Revenue management ou pricing em transporte, aviação ou hotelaria (domínios canônicos de RM).

• Pesquisa operacional e otimização (programação linear; Gurobi, HiGHS ou OR-Tools). • Deep learning aplicado (PyTorch, TensorFlow) — ex.: demanda com embeddings ou modelos sequenciais.

• ML causal (EconML, DoWhy) e modelagem bayesiana/hierárquica (PyMC, Stan). • Reinforcement Learning (em especial RL offline) e ecossistema Ray. • Pós-graduação (Mestrado/Doutorado) e experiência com LLMs/RAG.

Informações adicionais

Trabalho Remoto

Tempo de Projeto: 6 meses, com possibilidade de extensão/internalização.

Etapas do processo

  1. Etapa 1: Cadastro
  2. Etapa 2: Avaliação de Perfil
  3. Etapa 3: Teste Coploy
  4. Etapa 4: Entrevista Gestor
  5. Etapa 5: Entrevista Cliente
  6. Etapa 6: Contratação

Onde a inteligência humana amplifica o poder dos dados

Na Leega, não entregamos apenas linhas de código ou dashboards. Transformamos desafios tecnológicos complexos em impacto real. Com mais de 15 anos de estrada, unimos a profundidade da experiência humana à velocidade da Inteligência Artificial para criar soluções que mudam negócios e, acima de tudo, melhoram a vida das pessoas.

Somos uma consultoria de tecnologia, agnóstica e estratégica. Com escritórios no Brasil e na Europa, nosso time de mais de 580 talentos multidisciplinares vive e respira o ecossistema de Data Analytics, Cloud e IA. Dominamos a base, da Governança à Engenharia, para garantir que a tecnologia não seja apenas uma ferramenta, mas uma vantagem competitiva sustentável para os maiores players do mercado.