* Salário: R$ 6.000 a R$ 11.000 por mês (estimado)
* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.
Área: Tecnologia da Informação
Nível: Pleno
DESCRIÇÃO DA VAGA
Estamos em busca de um(a) CientistadeDadosPleno para liderar iniciativas de análise, modelagem e inteligência de dados que impactam diretamente decisões estratégicas do negócio.
Se você tem experiência sólida em análise de dados, pipelines de dados, machine learning e cloud, com experiência em estatística, desenvolvimento de modelos preditivos e aplicações direcionadas a bancos, seguradoras e análise de crédito, e gosta de transformar grandes volumes de informação em valor, essa vaga é pra você!
ATIVIDADES DO DIA A DIA:
- Atuar no desenvolvimento de modelos de machine learning, do discovery inicial à entrega final.
- Explorar, analisar e modelar grandes volumes de dados estruturados e não estruturados.
- Desbravar novas fontes de dados, internas e externas, para identificar padrões, analisar riscos e qualificar a informação.
- Construir pipelines avançados de processamento e transformação, desde datalakes até datawarehouses, garantindo padronização, qualidade e performance.
- Desenvolver e automatizar fluxos de dados utilizando PySpark,Apache Airflow, DVC e boas práticas de versionamento.
- Criar modelos supervisionados e não supervisionados focados em geração de valor para o negócio.
- Realizar consultas, análises e diagnósticos avançados em PostgreSQL.
- Implementar soluções escaláveis em ambientes cloud.
- Contribuir na evolução do ecossistema de dados da empresa.
- Acompanhar a performance de modelos em produção, propondo melhorias contínuas.
- Atuar diretamente com áreas de negócio e lideranças, traduzindo análises em decisões estratégicas.
REQUISITOS E QUALIFICAÇÕES:
- Acima 3 anos de experiência como Engenheiro de Machine Learning.
- Formação em Estatística, Ciência de dados, Engenharia, Matemática ou áreas correlatas.
- Conhecimento avançado em Pythone em análise avançada de dados.
- Conhecimento sólido em PostgreSQL.
- Vivência com manipulação de dados em Data Lakes e Data Warehouses
- Domínio em limpeza, manipulação e distribuição de grandes datasets.
- Domínio em desenvolvimento, validação e deploy de modelos em produção usando ferramentas como: Scikit-learn, XGBoost, PyTorch, CatBoost, PyCaret, LightGBM, Statsmodels, Prophet.
- Conhecimento de métricas de avaliação de modelos.
- Vivência com ambientes cloud (Azure, AWS, GCP ou Magalu Cloud).
- Capacidade de explicar descobertas, análises e resultados de forma clara e estratégica para públicos técnicos e não técnicos.
DIFERENCIAIS:
- Experiência no setor automotivo ou em projetos de controle de fraudes baseados em dados históricos.
- Conhecimento em PySparke processamento distribuído.
- Experiência prática com ApacheAirflowpara orquestração de pipelines.
- Conhecimento de métricas de avaliação de modelos de Scorecard (ex: Gini, KS - Kolmogorov-Smirnov, AUC-ROC, Curvas de Lorenz)
NOSSOS BENEFÍCIOS
- Vale Refeição/Alimentação
- Plano de Saúde com coparticipação (Sulamerica)
- Plano Odontológico
- Seguro de Vida
- Day Off no mês do aniversário
- Auxílio Creche
- Home-office
Aqui, você terá espaço para liderar projetos estratégicos com impacto direto no negócio, usando dados em escala, pipelines modernos e tecnologia de ponta. #VemSerConfidencial (Apenas para Cadastrados)
