* Salário: R$ 3.000 a R$ 6.000 por mês (estimado)
* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.
Área: Tecnologia da Informação
Nível: Junior
A Koopere está com oportunidade para projeto no GRUPO SUPERO.
Profissional especializado em infraestrutura cloud na AWS, com forte foco em experiência prática na administração de ambientes, automação e operação de sistemas em EC2. Atua diretamente na configuração, manutenção e otimização de workloads de dados, garantindo eficiência, estabilidade e escalabilidade.
Possui atuação hands-on na implementação de soluções, integração de serviços AWS e suporte a pipelines de dados, além de experiência na integração e disponibilização de dados para consumo analítico via Power BI.
Suas principais atividades serão:
- Administrar, configurar e otimizar ambientes cloud na AWS, garantindo estabilidade, performance e escalabilidade dos workloads de dados;
- Desenvolver e manter pipelines de dados com Python e PySpark, cobrindo ingestão, transformação e disponibilização para consumo analítico;
- Implementar e operar arquiteturas de data lake em camadas (raw, trusted, refined) utilizando Amazon S3, AWS Glue e Amazon Redshift;
- Orquestrar pipelines de dados com Apache Airflow, monitorando execuções e garantindo a confiabilidade dos fluxos;
- Processar grandes volumes de dados com Amazon EMR (Spark/Hadoop), atuando no tuning e na operação dos clusters;
- Integrar e disponibilizar dados para consumo analítico via Power BI, incluindo gestão de datasets, agendamento de atualizações e monitoramento de refreshes;
- Garantir boas práticas de segurança e governança de dados, aplicando políticas de IAM, criptografia e princípio do menor privilégio.
Quais vivências esperamos de você:
- Experiência prática com os principais serviços de dados da AWS: S3, Glue, Redshift e EMR;
- Desenvolvimento de pipelines de dados em Python, com vivência em processamento distribuído;
- Orquestração de fluxos de dados com Apache Airflow;
- Conhecimentos de Linux para administração de ambientes, gestão de usuários, acessos e configuração de serviços;
- Versionamento de código com Git e familiaridade com processos de CI/CD;
- Experiência na integração e disponibilização de dados no Power BI;
- Perfil hands-on, com capacidade de resolução de problemas em ambiente produtivo e boa comunicação com times técnicos.
Será legal se você tiver:
- Experiência com modelagem dimensional (star schema) e performance tuning no Redshift (dist keys, sort keys);
- Conhecimento em infraestrutura como código com Terraform;
- Familiaridade com AWS Glue Crawlers, Data Catalog e jobs ETL;
- Experiência com lifecycle policies, versionamento e particionamento no S3;
- Vivência com observabilidade via CloudWatch (logs e métricas);
- Conhecimento em Apache Airflow gerenciado (MWAA), Databricks ou arquiteturas Lakehouse.
