* Salário: R$ 12.000 a R$ 20.000 por mês (estimado)

* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.

Área: Engenharia

Nível: Senior

Posição - Engenheiro(a) de IA/ML - Sistema OCR Inteligente - Sênior (Remoto)

Você conhece a Icon?

Apaixonados por pessoas e especialistas em tecnologia. Nosso trabalho é encontrar talentos e soluções sob medida para os nossos clientes.

Vem encontrar o seu projeto ideal conosco e participar da comunidade ICON!

Sobre a Vaga

Código da vaga: A45943104560
Modelo de contratação: PJ

Você trabalhará em um sistema de ponta de processamento inteligente de documentos médicos que combina visão computacional, NLP e arquitetura serverless para automatizar a leitura e extração de informações de pedidos médicos, carteirinhas de convênio e documentos de identificação.

O sistema processa milhares de documentos diariamente com 96.5% de acurácia e tempo médio de resposta inferior a 5 segundos.

Requisitos e Qualificações

Essenciais:

Experiência sólida com Python (3.9+) e desenvolvimento de sistemas distribuídos
Conhecimento prático de Azure (Functions, Service Bus, Blob Storage, Cognitive Services)
Experiência com modelos de ML em produção (preferencialmente visão computacional e/ou NLP)
Familiaridade com frameworks: PyTorch/TensorFlow, Transformers, Ultralytics (YOLO)
Experiência com processamento de documentos e OCR
Conhecimento de arquitetura de microserviços e mensageria assíncrona

Stack Tecnológico

IA/ML: YOLOv8, BERT, GPT-4, Azure Cognitive Services
Cloud: Azure Functions, Service Bus, Blob Storage
Linguagens: Python 3.9+, SQL
Databases/Storages: PostgreSQL, AWS S3
Bibliotecas: OpenAI API, Transformers, Ultralytics, OpenCV, PIL
Observabilidade: Structlog, Azure Monitor, OpenTelemetry

Desafios do Projeto

Processar documentos médicos complexos (manuscritos, formulários, múltipla escolha) com alta precisão
Manter 9 Azure Functions interconectadas com processamento paralelo e tolerância a falhas
Alcançar F1-Score > 0.89 na predição de códigos de exames médicos
Implementar matching inteligente de planos de saúde com 80%+ de acurácia
Reduzir tempo de processamento end-to-end mantendo qualidade (target: <3.5s P50)

Atividades e Responsabilidades

Desenvolvimento e Otimização de Modelos de IA: Manter e evoluir modelos YOLOv8 para classificação de documentos, BERT para normalização de exames médicos, e integração com GPT-4 para extração estruturada de dados
Arquitetura Serverless: Desenvolver e otimizar Azure Functions em Python, implementando processamento assíncrono via Azure Service Bus com arquitetura event-driven
Pipeline de OCR Inteligente: Aprimorar pipeline que combina Azure Cognitive Services OCR com pós-processamento via LLMs, incluindo detecção de checkboxes, processamento de manuscritos e formulários médicos
Performance e Escalabilidade: Otimizar throughput do sistema (objetivo: >100 docs/min), implementar batching inteligente, reduzir latência end-to-end mantendo SLA de 99.9%
Integração de Sistemas: Manter integrações com APIs externas (validação CRM, Sensedia), PostgreSQL, AWS S3, e implementar novos conectores conforme necessário

Diferenciais

Experiência com fine-tuning de LLMs (GPT, BERT)
Conhecimento de algoritmos de string matching (Jaro-Winkler, Fuzzy Matching)
Experiência com processamento de imagens médicas ou documentos de saúde
Familiaridade com observabilidade (OpenTelemetry, Azure Monitor)
Experiência com otimização de inferência de modelos de ML

O que Oferecemos

Oportunidade de trabalhar com tecnologias de ponta em IA aplicada à saúde, impactando diretamente a eficiência operacional e qualidade do atendimento médico. Você terá autonomia para propor melhorias arquiteturais, implementar novas técnicas de ML e contribuir para um sistema que processa milhares de documentos críticos diariamente.

Perfil Ideal

Buscamos profissionais com mentalidade de resolução de problemas complexos, que gostem de trabalhar com IA aplicada a casos reais e tenham interesse em arquiteturas serverless escaláveis. Valorizamos experiência prática com modelos de ML em produção e capacidade de otimizar sistemas para alta performance e disponibilidade.

Local

São Paulo/SP

#vemserICON