* Salário: R$ 2.000 a R$ 5.000 por mês (estimado)

* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.

Área: Outros

Nível: Junior

El Científico de Datos especializado en modelos tipo Transformers de texto e imagen será responsable de diseñar, desarrollar, entrenar y optimizar modelos, orientados a resolver problemas de relación e identificación de similitudes entre distintas entidades de texto e imagen, dentro de grandes volúmenes de datos. El rol demanda una comprensión avanzada de técnicas de machine learning y deep learning aplicadas a problemas de emparejamiento y búsqueda semántica, así como la capacidad de traducir requisitos de negocio en soluciones robustas y escalables.

Responsabilidades e atribuições

Diseñar, desarrollar y entrenar modelos de búsqueda semántica para resolver problemas de emparejamiento entre texto e imágenes.
Realizar diagnóstico, limpieza y enriquecimiento de datasets para el correcto entrenamiento de modelos. Uso de IA generativa para ayudar en la creación de dichos datasets.
Definir las mejores métricas y validaciones para evaluar el rendimiento de los modelos según los objetivos del negocio.
Colaborar con equipos de ingeniería de ML para la integración y despliegue de los modelos desarrollados en los procesos productivos.
Documentar todo el proceso de desarrollo e investigación para asegurar la reproducibilidad y mantenibilidad de los modelos.
Identificar e investigar nuevas técnicas, algoritmos y herramientas para mejorar la precisión y eficiencia de los modelos.

Requisitos e qualificações

Habilidades Técnicas Requeridas:

Dominio en desarrollo y entrenamiento de modelos de Deep Learning (modelos Transformers de texto e imágenes, en un contexto supervisado y seimi-supervisado).
Conocimiento de técnicas de GenAI y prompt engineering son deseables.
Amplia experiencia en el manejo de frameworks de machine learning y deep learning como Scikit-learn, PyTorch, XGBoost, Sentence Transformers, Hugging Face, FAISS.
Experiencia en el manejo de bases de datos vectoriales (Milvus, Qdrant, Pinecone).
Conocimientos sólidos en procesamiento y limpieza de datos, uso de regex y data wrangling con Pandas y Polars. Conocimiento en técnicas avanzadas de feature engineering son deseables.
Experiencia práctica en evaluación de modelos supervisados.
Competencia en programación en Python y SQL (indispensable); conocimientos adicionales en BigQuery y PySpark son deseables.
Experiencia trabajando con grandes volúmenes de datos y optimización de pipelines de modelado.
Deseable: experiencia implementando modelos en ambientes cloud (AWS, GCP, Azure).

Habilidades Soft Requeridas:

Pensamiento analítico y capacidad de abstracción para estructurar soluciones algorítmicas complejas.
Comunicación clara y efectiva para presentar hallazgos técnicos a equipos multidisciplinarios.
Uso y adaptabilidad de métricas técnicas como KPI's del negocio.
Capacidad de trabajar de manera colaborativa con equipos de ciencia de datos, ingeniería de datos, back-end y front-end; así como con stakeholders del negocio.
Proactividad, autonomía y orientación a resultados.
Adaptabilidad para trabajar en entornos dinámicos y bajo objetivos desafiantes.

Creer para co-crear

¿Buscas un lugar donde tus ideas brillen?

Con más de 38 años y una presencia global, en Stefanini transformamos el mañana juntos. Aquí, cada acción cuenta y cada idea puede marcar la diferencia. Únete a un equipo que valora la innovación, el respeto y el compromiso.

Si eres una persona disruptiva, te mantienes en aprendizaje continuo y la innovación está en tu ADN, entonces somos lo que buscas. ¡Ven y construyamos juntos un futuro mejor!

Científico de Datos

Responsabilidades e atribuições

Requisitos e qualificações

Informações adicionais

Etapas do processo

Creer para co-crear