* Salário: R$ 6.000 a R$ 11.000 por mês (estimado)

* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.

Área: Tecnologia da Informação

Nível: Pleno

DESCRIÇÃO DA VAGA

Estamos em busca de um(a) CientistadeDadosPleno para liderar iniciativas de análise, modelagem e inteligência de dados que impactam diretamente decisões estratégicas do negócio.

Se você tem experiência sólida em análise de dados, pipelines de dados, machine learning e cloud, com experiência em estatística, desenvolvimento de modelos preditivos e aplicações direcionadas a bancos, seguradoras e análise de crédito, e gosta de transformar grandes volumes de informação em valor, essa vaga é pra você!

ATIVIDADES DO DIA A DIA:

Atuar no desenvolvimento de modelos de machine learning, do discovery inicial à entrega final.
Explorar, analisar e modelar grandes volumes de dados estruturados e não estruturados.
Desbravar novas fontes de dados, internas e externas, para identificar padrões, analisar riscos e qualificar a informação.
Construir pipelines avançados de processamento e transformação, desde datalakes até datawarehouses, garantindo padronização, qualidade e performance.
Desenvolver e automatizar fluxos de dados utilizando PySpark,Apache Airflow, DVC e boas práticas de versionamento.
Criar modelos supervisionados e não supervisionados focados em geração de valor para o negócio.
Realizar consultas, análises e diagnósticos avançados em PostgreSQL.
Implementar soluções escaláveis em ambientes cloud.
Contribuir na evolução do ecossistema de dados da empresa.
Acompanhar a performance de modelos em produção, propondo melhorias contínuas.
Atuar diretamente com áreas de negócio e lideranças, traduzindo análises em decisões estratégicas.

REQUISITOS E QUALIFICAÇÕES:

Acima 3 anos de experiência como Engenheiro de Machine Learning.
Formação em Estatística, Ciência de dados, Engenharia, Matemática ou áreas correlatas.
Conhecimento avançado em Pythone em análise avançada de dados.
Conhecimento sólido em PostgreSQL.
Vivência com manipulação de dados em Data Lakes e Data Warehouses
Domínio em limpeza, manipulação e distribuição de grandes datasets.
Domínio em desenvolvimento, validação e deploy de modelos em produção usando ferramentas como: Scikit-learn, XGBoost, PyTorch, CatBoost, PyCaret, LightGBM, Statsmodels, Prophet.
Conhecimento de métricas de avaliação de modelos.
Vivência com ambientes cloud (Azure, AWS, GCP ou Magalu Cloud).
Capacidade de explicar descobertas, análises e resultados de forma clara e estratégica para públicos técnicos e não técnicos.

DIFERENCIAIS:

Experiência no setor automotivo ou em projetos de controle de fraudes baseados em dados históricos.
Conhecimento em PySparke processamento distribuído.
Experiência prática com ApacheAirflowpara orquestração de pipelines.
Conhecimento de métricas de avaliação de modelos de Scorecard (ex: Gini, KS - Kolmogorov-Smirnov, AUC-ROC, Curvas de Lorenz)

NOSSOS BENEFÍCIOS

Vale Refeição/Alimentação
Plano de Saúde com coparticipação (Sulamerica)
Plano Odontológico
Seguro de Vida
Day Off no mês do aniversário
Auxílio Creche
Home-office

Aqui, você terá espaço para liderar projetos estratégicos com impacto direto no negócio, usando dados em escala, pipelines modernos e tecnologia de ponta. #VemSerConfidencial (Apenas para Cadastrados)

Cientista de Dados Pleno - P&D