* Salário: R$ 12.000 a R$ 20.000 por mês (estimado)
* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.
Área: Engenharia
Nível: Senior
Posição - Engenheiro(a) de IA/ML - Sistema OCR Inteligente - Sênior (Remoto)
Você conhece a Icon?
Apaixonados por pessoas e especialistas em tecnologia. Nosso trabalho é encontrar talentos e soluções sob medida para os nossos clientes.
Vem encontrar o seu projeto ideal conosco e participar da comunidade ICON!
Sobre a Vaga
Código da vaga: A45943104560
Modelo de contratação: PJ
Você trabalhará em um sistema de ponta de processamento inteligente de documentos médicos que combina visão computacional, NLP e arquitetura serverless para automatizar a leitura e extração de informações de pedidos médicos, carteirinhas de convênio e documentos de identificação.
O sistema processa milhares de documentos diariamente com 96.5% de acurácia e tempo médio de resposta inferior a 5 segundos.
Requisitos e Qualificações
Essenciais:
- Experiência sólida com Python (3.9+) e desenvolvimento de sistemas distribuídos
- Conhecimento prático de Azure (Functions, Service Bus, Blob Storage, Cognitive Services)
- Experiência com modelos de ML em produção (preferencialmente visão computacional e/ou NLP)
- Familiaridade com frameworks: PyTorch/TensorFlow, Transformers, Ultralytics (YOLO)
- Experiência com processamento de documentos e OCR
- Conhecimento de arquitetura de microserviços e mensageria assíncrona
Stack Tecnológico
- IA/ML: YOLOv8, BERT, GPT-4, Azure Cognitive Services
- Cloud: Azure Functions, Service Bus, Blob Storage
- Linguagens: Python 3.9+, SQL
- Databases/Storages: PostgreSQL, AWS S3
- Bibliotecas: OpenAI API, Transformers, Ultralytics, OpenCV, PIL
- Observabilidade: Structlog, Azure Monitor, OpenTelemetry
Desafios do Projeto
- Processar documentos médicos complexos (manuscritos, formulários, múltipla escolha) com alta precisão
- Manter 9 Azure Functions interconectadas com processamento paralelo e tolerância a falhas
- Alcançar F1-Score > 0.89 na predição de códigos de exames médicos
- Implementar matching inteligente de planos de saúde com 80%+ de acurácia
- Reduzir tempo de processamento end-to-end mantendo qualidade (target: <3.5s P50)
Atividades e Responsabilidades
- Desenvolvimento e Otimização de Modelos de IA: Manter e evoluir modelos YOLOv8 para classificação de documentos, BERT para normalização de exames médicos, e integração com GPT-4 para extração estruturada de dados
- Arquitetura Serverless: Desenvolver e otimizar Azure Functions em Python, implementando processamento assíncrono via Azure Service Bus com arquitetura event-driven
- Pipeline de OCR Inteligente: Aprimorar pipeline que combina Azure Cognitive Services OCR com pós-processamento via LLMs, incluindo detecção de checkboxes, processamento de manuscritos e formulários médicos
- Performance e Escalabilidade: Otimizar throughput do sistema (objetivo: >100 docs/min), implementar batching inteligente, reduzir latência end-to-end mantendo SLA de 99.9%
- Integração de Sistemas: Manter integrações com APIs externas (validação CRM, Sensedia), PostgreSQL, AWS S3, e implementar novos conectores conforme necessário
Diferenciais
- Experiência com fine-tuning de LLMs (GPT, BERT)
- Conhecimento de algoritmos de string matching (Jaro-Winkler, Fuzzy Matching)
- Experiência com processamento de imagens médicas ou documentos de saúde
- Familiaridade com observabilidade (OpenTelemetry, Azure Monitor)
- Experiência com otimização de inferência de modelos de ML
O que Oferecemos
Oportunidade de trabalhar com tecnologias de ponta em IA aplicada à saúde, impactando diretamente a eficiência operacional e qualidade do atendimento médico. Você terá autonomia para propor melhorias arquiteturais, implementar novas técnicas de ML e contribuir para um sistema que processa milhares de documentos críticos diariamente.
Perfil Ideal
Buscamos profissionais com mentalidade de resolução de problemas complexos, que gostem de trabalhar com IA aplicada a casos reais e tenham interesse em arquiteturas serverless escaláveis. Valorizamos experiência prática com modelos de ML em produção e capacidade de otimizar sistemas para alta performance e disponibilidade.
Local
São Paulo/SP
#vemserICON
