* Salário: R$ 2.000 a R$ 5.000 por mês (estimado)
* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.
Área: Outros
Nível: Junior
El Científico de Datos especializado en modelos tipo Transformers de texto e imagen será responsable de diseñar, desarrollar, entrenar y optimizar modelos, orientados a resolver problemas de relación e identificación de similitudes entre distintas entidades de texto e imagen, dentro de grandes volúmenes de datos. El rol demanda una comprensión avanzada de técnicas de machine learning y deep learning aplicadas a problemas de emparejamiento y búsqueda semántica, así como la capacidad de traducir requisitos de negocio en soluciones robustas y escalables.
Responsabilidades e atribuições
- Diseñar, desarrollar y entrenar modelos de búsqueda semántica para resolver problemas de emparejamiento entre texto e imágenes.
- Realizar diagnóstico, limpieza y enriquecimiento de datasets para el correcto entrenamiento de modelos. Uso de IA generativa para ayudar en la creación de dichos datasets.
- Definir las mejores métricas y validaciones para evaluar el rendimiento de los modelos según los objetivos del negocio.
- Colaborar con equipos de ingeniería de ML para la integración y despliegue de los modelos desarrollados en los procesos productivos.
- Documentar todo el proceso de desarrollo e investigación para asegurar la reproducibilidad y mantenibilidad de los modelos.
- Identificar e investigar nuevas técnicas, algoritmos y herramientas para mejorar la precisión y eficiencia de los modelos.
Requisitos e qualificações
Habilidades Técnicas Requeridas:
- Dominio en desarrollo y entrenamiento de modelos de Deep Learning (modelos Transformers de texto e imágenes, en un contexto supervisado y seimi-supervisado).
- Conocimiento de técnicas de GenAI y prompt engineering son deseables.
- Amplia experiencia en el manejo de frameworks de machine learning y deep learning como Scikit-learn, PyTorch, XGBoost, Sentence Transformers, Hugging Face, FAISS.
- Experiencia en el manejo de bases de datos vectoriales (Milvus, Qdrant, Pinecone).
- Conocimientos sólidos en procesamiento y limpieza de datos, uso de regex y data wrangling con Pandas y Polars. Conocimiento en técnicas avanzadas de feature engineering son deseables.
- Experiencia práctica en evaluación de modelos supervisados.
- Competencia en programación en Python y SQL (indispensable); conocimientos adicionales en BigQuery y PySpark son deseables.
- Experiencia trabajando con grandes volúmenes de datos y optimización de pipelines de modelado.
- Deseable: experiencia implementando modelos en ambientes cloud (AWS, GCP, Azure).
Habilidades Soft Requeridas:
- Pensamiento analítico y capacidad de abstracción para estructurar soluciones algorítmicas complejas.
- Comunicación clara y efectiva para presentar hallazgos técnicos a equipos multidisciplinarios.
- Uso y adaptabilidad de métricas técnicas como KPI's del negocio.
- Capacidad de trabajar de manera colaborativa con equipos de ciencia de datos, ingeniería de datos, back-end y front-end; así como con stakeholders del negocio.
- Proactividad, autonomía y orientación a resultados.
- Adaptabilidad para trabajar en entornos dinámicos y bajo objetivos desafiantes.
Informações adicionais
Brindar soporte técnico y asesoramiento en temas relacionados con ciencia de datos a equipos internos.
Etapas do processo
- Etapa 1: Cadastro
- Etapa 2: Presentación de CV
- Etapa 3: Entrevistas
- Etapa 4: Confirmación de candidato
- Etapa 5: Onboarding
- Etapa 6: Contratação
Creer para co-crear
¿Buscas un lugar donde tus ideas brillen?
Con más de 38 años y una presencia global, en Stefanini transformamos el mañana juntos. Aquí, cada acción cuenta y cada idea puede marcar la diferencia. Únete a un equipo que valora la innovación, el respeto y el compromiso.
Si eres una persona disruptiva, te mantienes en aprendizaje continuo y la innovación está en tu ADN, entonces somos lo que buscas. ¡Ven y construyamos juntos un futuro mejor!
