* Salário: R$ 3.000 a R$ 6.000 por mês (estimado)
* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.
Área: Tecnologia da Informação
Nível: Junior
Descrição da Vaga:
Buscamos um Backend Developer com forte domínio técnico para desenvolver e manter pipelines de RAG usados pelos nossos agentes de IA. Você irá criar APIs, serviços, automações e toda a infraestrutura backend responsável pela ingestão, processamento, chunking, embeddings, indexação e recuperação de conhecimento.
Responsabilidades:
Construir pipelines completos de RAG: ingestão → limpeza → normalização → chunking → embeddings → indexação → recuperação;
Desenvolver serviços de chunking inteligente para PDFs, contratos, legislações e tabelas;
Integrar e manter vector stores (FAISS, Pinecone, Elastic, Weaviate, Milvus);
Criar endpoints de consulta rápidos, seguros e otimizados para agentes de IA;
Desenvolver rotinas automáticas de atualização de bases (event-driven ou CRON);
Criar serviços com re-ranking híbrido (BM25 + embeddings) quando necessário;
Implementar logs, monitoramento, auditoria e versionamento das bases vetoriais;
Integrar pipelines com o ecossistema interno (AgentOS, agentes e tools);
Colaborar com Engenheiros de IA, DevOps e Product;
Garantir performance, segurança e governança de todo o pipeline.
Outros Requisitos e qualificações, ferramentas, habilidades, cursos e certificações:
Experiência sólida em backend (Python, Node.js ou ambos);
Domínio de APIs REST, microsserviços, integrações e arquitetura orientada a eventos;
Experiência com pipelines de dados (limpeza, parsing, validação, transformação);
Conhecimento prático de RAG, embeddings, vetorização e estruturas documentais;
Experiência com vector databases (FAISS, Pinecone, Elastic, Milvus, Weaviate);
Familiaridade com parsing de PDFs, OCR e documentos complexos;
Experiência com AWS (S3, Lambda, API Gateway, ECS, Step Functions, Agent Strands);
Conhecimento de testes automatizados e pipelines CI/CD;
Forte entendimento de performance, caching e otimização de latência.
Benefícios Confidencial (Apenas para Cadastrados):
💪🏽 TotalPassWellhub;
👨🏾🤝👩🏽🤝👩🏼 Seguro de vida em grupo;
🍕🛒 Vale Refeição/ Alimentação;
🏨 Plano de saúde e odontológico - Bradesco;
💻 Ações de treinamento: palestras, fóruns, trocas e conversas de conhecimentos relativos ao nosso negócio. Estamos em constante conexão para aprender mais e juntos;
👉 Programa +Confidencial (Apenas para Cadastrados)er: programa interno de indicação onde você indica um colega para trabalhar conosco e se esse relacionamento der match, você ganha um prêmio;
💲 Parcerias: quer desconto? Temos um grupo no Workplace onde divulgamos parcerias com instituições de ensino, escolas de idiomas, academias, restaurantes, produtos e outros serviços.
