* Salário: R$ 6.000 a R$ 11.000 por mês (estimado)
* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.
Área: Tecnologia da Informação
Nível: Pleno
Na Confidencial (Apenas para Cadastrados), acreditamos no poder da colaboração. Co-criamos soluções inovadoras em parceria com nossos clientes, combinando tecnologia de ponta, inteligência artificial e a criatividade humana. Estamos na vanguarda da resolução de problemas de negócios, proporcionando impacto real em escala global.
Ao se juntar à Confidencial (Apenas para Cadastrados), você se torna parte de uma jornada global de transformação. Estamos empenhados em criar impacto positivo não apenas nos negócios, mas também na vida de nossos colaboradores. Se você procura uma oportunidade de crescimento profissional em uma empresa que valoriza inovação, respeito, autonomia e parceria, você encontra aqui!
Junte-se a nós e seja parte da mudança!
Modelo de trabalho- Híbrido - DF
#LI-AA2
Responsabilidades e atribuições
Buscamos um(a) Engenheiro(a) de Dados Pleno para atuar na construção e evolução de pipelines de dados voltados à alimentação de soluções de Inteligência Artificial, com foco em RAG (Retrieval-Augmented Generation) e construção de matriz de conhecimento corporativa.
O(a) profissional será responsável por transformar dados estruturados e não estruturados em ativos prontos para consumo por modelos de IA, garantindo qualidade, governança e performance dos dados.
Responsabilidades:
- Atuar no desenvolvimento de pipelines de ingestão, transformação e enriquecimento de dados para uso em IA
- Trabalhar com dados estruturados e não estruturados (textos, PDFs, HTML, áudios, entre outros)
- Implementar processos de chunking, embeddings e indexação vetorial
- Construir e manter datasets voltados à matriz de conhecimento corporativa
- Desenvolver pipelines utilizando Databricks (Spark / PySpark)
- Atuar com arquitetura medalhão (bronze, prata e ouro)
- Integrar dados com bancos vetoriais (Azure AI Search, pgvector, entre outros)
- Garantir performance, escalabilidade e confiabilidade dos pipelines
- Aplicar boas práticas de qualidade de dados (completude, consistência e versionamento)
- Implementar políticas de atualização, retenção e expurgo de dados
- Garantir rastreabilidade e auditabilidade dos dados utilizados pelos modelos
- Atuar em conjunto com times de AI/ML na preparação e otimização de dados
- Apoiar estratégias de recuperação de informação (RAG)
- Otimizar dados para melhorar a relevância e precisão das respostas dos modelos
Requisitos e qualificações
Formação
- Ensino superior completo em Tecnologia da Informação, Engenharia, Sistemas de Informação ou áreas correlatas
Conhecimentos necessários
- Experiência sólida em engenharia de dados
- Conhecimento em Python e/ou PySpark
- Experiência com Databricks e Spark (batch e/ou streaming)
- Experiência com pipelines de dados (ETL/ELT)
- Modelagem de dados (Data Lake / Lakehouse)
- Experiência com dados não estruturados (documentos, textos, etc.)
- Integração e consumo de APIs
Habilidades técnicas
- Capacidade de atuar com autonomia na construção de pipelines
- Conhecimento em arquitetura moderna de dados
- Experiência com processamento e preparação de dados para IA
- Atuação em ambientes complexos com múltiplas integrações
Competências comportamentais
- Capacidade analítica e pensamento estruturado
- Autonomia e postura investigativa
- Facilidade para lidar com dados não estruturados
- Boa comunicação e colaboração com times multidisciplinares
Requisitos desejáveis
- Experiência com RAG (Retrieval-Augmented Generation)
- Conhecimento em embeddings e bancos vetoriais
- Experiência com chunking de documentos
- Vivência com LangChain ou frameworks similares
- Conhecimento em OpenAI, Azure OpenAI ou outros LLMs
- Conhecimento em indexação semântica e busca vetorial
- Experiência com ingestão de documentos corporativos (PDF, Word, HTML)
- Vivência com pipelines de dados voltados para IA
- Experiência em ambientes corporativos complexos ou projetos de grande porte
Informações adicionais
🍛 Vale-alimentação ou vale-refeição;
👨🏼🎓 Desconto em cursos, universidades e instituições de idiomas;
📚 Academia Confidencial (Apenas para Cadastrados) — plataforma com cursos on-line, gratuitos, atualizados e com certificado;
🗣 Mentoring;
💉 Clube de vantagens para consultas e exames;
🏥 Assistência médica;
🦷 Assistência odontológica;
💰 Clube de vantagens e descontos nos melhores estabelecimentos;
🛫 Clube de viagens;
🐶 Convênio para pets.
Etapas do processo
- Etapa 1: Cadastro
- Etapa 2: Mapeamento Comportamental
- Etapa 3: Entrevista Comportamental
- Etapa 4: Entrevista Cliente
- Etapa 5: Contratação
Confidencial (Apenas para Cadastrados): Acreditar para Cocriar 🌟
Na Confidencial (Apenas para Cadastrados), a inovação não é apenas uma meta; é uma jornada que trilhamos juntos, onde a colaboração se torna a essência da transformação. 🤝 Com 37 anos de história e uma presença global em mais de 40 países, contamos com uma equipe de 38 mil talentos apaixonados, prontos para transformar desafios em oportunidades por meio da tecnologia. 💡
Acreditamos que cada projeto é uma oportunidade e que, juntos, podemos moldar um futuro mais ágil, eficiente e conectado. Nossa missão vai além de oferecer soluções: buscamos cocriar com nossos clientes, integrando inteligência artificial e tecnologias emergentes para revolucionar o cotidiano das empresas. 🌍✨
Aqui, cada voz conta e cada ideia tem o poder de impactar. Valorizamos a humildade, o respeito, o comprometimento e a coragem, construindo uma cultura onde a inovação floresce. Aqui, liderar é dar o exemplo, e é por isso que inspiramos um ambiente dinâmico onde tecnologia e talento se complementam.
Se você sonha grande, tem coragem de desafiar o convencional e quer fazer parte de uma equipe que acredita no poder da cocriação, junte-se a nós! Vamos, juntos, acreditar e cocriar um futuro brilhante, onde cada passo representa uma nova conquista!🚀✨
