* Salário: R$ 6.000 a R$ 11.000 por mês (estimado)

* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.

Área: Tecnologia da Informação

Nível: Pleno

SOBRE A VAGA

Você gosta de construir as pontes entre dados brutos e decisões inteligentes? Tem energia para trabalhar com grandes volumes, pipelines complexos e fontes de dados diversas?

A Confidencial (Apenas para Cadastrados) está em busca de um(a) Engenheiro(a) de Dados Pleno para construir e evoluir nossa infraestrutura de dados. Você atuará na criação de pipelines escaláveis, ingestão de dados de APIs públicas e privadas, e colaboração direta com cientistas de dados e times de produto.

SOBRE A Confidencial (Apenas para Cadastrados)

Somos uma empresa de tecnologia especializada em soluções digitais sob medida para empresas que buscam eficiência, inovação e crescimento sustentável.

Atuamos com times próximos dos clientes, cultura colaborativa e foco em entregas de qualidade. Valorizamos autonomia, aprendizado contínuo e desenvolvimento de carreira, com um ambiente que incentiva troca, responsabilidade e protagonismo.

SUAS PRINCIPAIS RESPONSABILIDADES

Construir e manter pipelines de dados escaláveis utilizando Apache Airflow e Spark;

Ingerir, transformar e enriquecer dados provenientes de APIs públicas (IBGE, IPEA) e fontes internas;

Desenvolver soluções de indexação e busca com ElasticSearch para análise de grandes volumes;

Colaborar com cientistas de dados na preparação de dados para modelos de Machine Learning;

Garantir qualidade, rastreabilidade e governança dos dados ao longo do pipeline;

Monitorar e otimizar a performance de jobs Spark em ambiente distribuído;

Documentar arquiteturas de dados e fluxos de ingestão para o time técnico.

O QUE BUSCAMOS EM VOCÊ

Proficiência em Python para processamento e manipulação de dados;

Experiência com Apache Airflow para orquestração de pipelines de dados;

Conhecimento em Apache Spark (PySpark) para processamento distribuído;

Familiaridade com ElasticSearch: indexação, queries DSL e análise de logs;

Experiência no consumo de APIs REST, especialmente IBGE e IPEA;

Noções de Machine Learning e preparação de feature sets para modelos preditivos.

DIFERENCIAIS

Experiência com Delta Lake ou Apache Iceberg;

Conhecimento em plataformas de nuvem (AWS Glue, EMR, S3 ou equivalentes);

Familiaridade com dbt para transformações analíticas;

Experiência com Kafka ou outros sistemas de streaming de dados;

Contribuições ou projetos com dados abertos do governo brasileiro.

O QUE OFERECEMOS

Remuneração competitiva alinhada ao mercado;

Onboarding estruturado e acompanhamento próximo no início;

Ambiente colaborativo, com autonomia e espaço para ideias;

Bônus por performance e ações internas de desenvolvimento;

Reembolso de alimentação nos dias presenciais;

Participação em projetos relevantes com impacto real no negócio;

Contratos PJ ou Cooperativa;

Modelo híbrido — 50% do tempo presencial em Votorantim/SP.

Engenheiro de Dados Pleno