Caro usuário, habilite o javascript para que esse site funcione corretamente.

Senior Data Engineer

CLT (Efetivo)Presencial (Local)Belo Horizonte-MGEmpresa Confidencial (Cadastre-se)

* Salário: R$ 11.000 a R$ 20.000 por mês (estimado)

* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.

Área: Tecnologia da Informação

Nível: Senior

1.Sobre a Marisa.Care

Em 2025 crescemos 11x, atuando nas principais redes do Brasil, como Rede D’Or e Hospitales MAC, iniciando nossa internacionalização com uma rede hospitalar no México. Fomos acelerados pela Microsoft for Startups, participamos do NVIDIA Inception e nossa última rodada foi de R$ 8M, liderada pela Afya.

2.Descrição da Vaga

Como Senior Data Engineer, você será responsável por construir e operar a espinha dorsal de dados de um produto digital de saúde de alto impacto, onde a IA é parte central da solução. Com perfil hands-on e forte senioridade técnica, você projetará pipelines robustos, garantirá a qualidade e governança dos dados que alimentam modelos inteligentes e colaborará de perto com os times de engenharia e IA para transformar dados clínicos e operacionais em ativos confiáveis e rastreáveis — seguindo os mais altos padrões de segurança e conformidade exigidos pelo setor de saúde.

  • Atuação prática
  • Projetar, construir e manter pipelines de dados robustos (ETL/ELT) que alimentam tanto modelos clássicos de ML quanto sistemas RAG e LLMs em produção;
  • Garantir qualidade, governança e rastreabilidade de dados com boas práticas de data contracts, catalogação e versionamento de datasets e artefatos;
  • Estruturar e operar plataformas de MLOps — feature stores, model registry, experiment tracking, serving e monitoramento de performance em produção;
  • Implementar pipelines de retreinamento contínuo, drift detection e critérios objetivos de promoção e rollback de modelos com base em métricas de negócio e técnicas;
  • Integrar pipelines de dados e ML em fluxos CI/CD, garantindo reprodutibilidade e rastreabilidade de experimentos;
  • Estabelecer observabilidade sobre os dados: tracing, logs, métricas de qualidade e alertas sobre degradação de pipelines e modelos;
  • Colaborar ativamente com o time de IA na construção de pipelines RAG — ingestão, chunking, indexação, embeddings e buscas híbridas;
  • Garantir conformidade com LGPD e normas aplicáveis ao setor de saúde, aplicando boas práticas de mascaramento de dados, gestão de PII e segurança by design;
  • Requisitos
  • Experiência sólida como Senior Data Engineer ou papel equivalente em produtos digitais de alta escala;
  • Domínio de Python para engenharia de dados e pipelines de ML;
  • Experiência com cloud platforms (Azure, AWS ou GCP) e ferramentas de orquestração de pipelines (Airflow, Prefect ou equivalentes);
  • Experiência com plataformas MLOps: MLflow, Databricks, SageMaker ou similares;
  • Sólido conhecimento em bancos de dados SQL, NoSQL e vetoriais, além de mensageria/eventos (Kafka, RabbitMQ ou equivalentes);
  • Familiaridade com LLMs em produção e sistemas RAG — ou forte disposição para aprender;
  • Conhecimento em segurança de dados, mascaramento de PII e conformidade com LGPD e normas aplicáveis ao setor de saúde;
  • Capacidade de atuar com autonomia, entregar com qualidade e comunicar decisões técnicas com clareza para audiências técnicas e não-técnicas.
  • Diferencial
  • Experiência com tracing e avaliações de pipelines RAG (Langfuse, Ragas, DeepEval ou equivalentes);
  • Conhecimento em técnicas de busca híbrida (BM25 + densa), re-rankers e embeddings proprietários;
  • Experiência prévia em healthtech, fintechs ou setores com alta regulação de dados;
  • Contribuições open source ou participação ativa em comunidades de dados e IA.
  • Informações da Posição

Contratação via PJ

Modelo Híbrido – Belo Horizonte


BUSCAS DE VAGAS SEMELHANTES