Caro usuário, habilite o javascript para que esse site funcione corretamente.

Cloud Data Architect / Data Engineer (AWS) | Supero Outsourcing

* Salário: R$ 3.000 a R$ 6.000 por mês (estimado)

* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.

Área: Tecnologia da Informação

Nível: Junior

A Koopere está com oportunidade para projeto no GRUPO SUPERO.

Profissional especializado em infraestrutura cloud na AWS, com forte foco em experiência prática na administração de ambientes, automação e operação de sistemas em EC2. Atua diretamente na configuração, manutenção e otimização de workloads de dados, garantindo eficiência, estabilidade e escalabilidade.

Possui atuação hands-on na implementação de soluções, integração de serviços AWS e suporte a pipelines de dados, além de experiência na integração e disponibilização de dados para consumo analítico via Power BI.

Suas principais atividades serão:

  • Administrar, configurar e otimizar ambientes cloud na AWS, garantindo estabilidade, performance e escalabilidade dos workloads de dados;
  • Desenvolver e manter pipelines de dados com Python e PySpark, cobrindo ingestão, transformação e disponibilização para consumo analítico;
  • Implementar e operar arquiteturas de data lake em camadas (raw, trusted, refined) utilizando Amazon S3, AWS Glue e Amazon Redshift;
  • Orquestrar pipelines de dados com Apache Airflow, monitorando execuções e garantindo a confiabilidade dos fluxos;
  • Processar grandes volumes de dados com Amazon EMR (Spark/Hadoop), atuando no tuning e na operação dos clusters;
  • Integrar e disponibilizar dados para consumo analítico via Power BI, incluindo gestão de datasets, agendamento de atualizações e monitoramento de refreshes;
  • Garantir boas práticas de segurança e governança de dados, aplicando políticas de IAM, criptografia e princípio do menor privilégio.

Quais vivências esperamos de você:

  • Experiência prática com os principais serviços de dados da AWS: S3, Glue, Redshift e EMR;
  • Desenvolvimento de pipelines de dados em Python, com vivência em processamento distribuído;
  • Orquestração de fluxos de dados com Apache Airflow;
  • Conhecimentos de Linux para administração de ambientes, gestão de usuários, acessos e configuração de serviços;
  • Versionamento de código com Git e familiaridade com processos de CI/CD;
  • Experiência na integração e disponibilização de dados no Power BI;
  • Perfil hands-on, com capacidade de resolução de problemas em ambiente produtivo e boa comunicação com times técnicos.

Será legal se você tiver:

  • Experiência com modelagem dimensional (star schema) e performance tuning no Redshift (dist keys, sort keys);
  • Conhecimento em infraestrutura como código com Terraform;
  • Familiaridade com AWS Glue Crawlers, Data Catalog e jobs ETL;
  • Experiência com lifecycle policies, versionamento e particionamento no S3;
  • Vivência com observabilidade via CloudWatch (logs e métricas);
  • Conhecimento em Apache Airflow gerenciado (MWAA), Databricks ou arquiteturas Lakehouse.