* Salário: R$ 11.000 a R$ 20.000 por mês (estimado)

* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.

Área: Tecnologia da Informação

Nível: Senior

Somos ávidos por tecnologia, criatividade e desafios.

Se você gosta de desafios, aprendizado constante e valoriza as conexões pessoais, junte-se a nós!

# Valorizamos a diversidade e acreditamos que ela é fundamental para a inovação e entregas de valor aos nossos clientes. Todas as nossas vagas são destinadas a todas as pessoas, com ou sem deficiência, independentemente de idade, gênero, orientação sexual, etnia, religião ou qualquer outra característica. Se você se identifica com a posição, venha fazer parte do nosso time!

O QUE BUSCAMOS?

Buscamos um(a) Engenheiro(a) de Dados, em níveis de carreira Sênior, que queiram trabalhar conosco em um ambiente descontraído e dinâmico, com aprendizado contínuo no desenvolvimento de grandes projetos, junto a grandes clientes nacionais e internacionais. Temos escritórios em São Paulo e Chicago (EUA), mas a nossa atuação é remota: por aqui preferimos chamar de anywhere office.

O QUE ESSE PROFISSIONAL IRÁ FAZER?

Projetar e implementar pipelines de dados escaláveis usando AWS Glue/Spark, Step Functions, Lambda, EMR e integrações.
Modelar e otimizar Data Lake/Lakehouse.
Administrar e tunar Amazon Redshift (sort/dist keys, WLM/Auto WLM, RA3, Concurrency Scaling, materialized views, Spectrum, UNLOAD/COPY, late-binding views).
Garantir qualidade de dados e observabilidade.
Implementar governança e segurança (Lake Formation, IAM least-privilege, KMS, RLS/CLS, mascaramento, auditoria).
Automatizar infraestrutura com IaC (Terraform), CI/CD (GitHub Actions/GitLab CI), versionamento e revisão de código.
Realizar code reviews criteriosos (legibilidade, padrões, testes, custos/performance), além de mentorar o time para elevar a barra técnica.
Trabalhar com times de produto, analytics e ciência de dados para disponibilizar datasets confiáveis e bem documentados (dbt/Docs, data contracts, lineage).
Otimizar custo/performance continuamente (storage tiers, workload management, caching, compressão, layout físico, vacuum/maintenance).

O QUE É NECESSÁRIO PARA A POSIÇÃO?

Experiência sólida em AWS com foco prático em Redshift e S3.
Vivência com ETL/ELT usando AWS Glue (PySpark) e/ou EMR/Spark; orquestração com Step Functions ou Airflow.
Domínio de SQL avançado (window functions, CTEs, otimização de queries) e noções de modelagem dimensional (Star/Snowflake) e/ou Data Vault.
Conhecimentos de formato columnar, particionamento por data/chaves, Glue Catalog/Athena.
Boas práticas de segurança (IAM/KMS), monitoramento (CloudWatch) e logging.
Python (Pandas/PySpark) para jobs e utilitários; Lambda (Serverless).
Domínio de Git e pipelines de CI/CD.
Comunicação clara, mentalidade de dono(a) e foco em entrega com qualidade.
Inglês técnico.

O QUE SERIA UM DIFERENCIAL?

dbt (tests, docs, exposures) e data lineage.
Lakehouse com Apache Iceberg/Delta/Hudi; Athena/Spectrum avançado e Redshift Spectrum bem estruturado.
Qualidade de dados com Great Expectations ou Deequ; contratos de esquema (Avro/Protobuf), Schema Registry.
FinOps aplicado a dados (custo por workload, chargeback/showback, otimização de armazenamento/transferência).
Observabilidade: CloudWatch Logs/ Metrics, OpenTelemetry, QMRs no Redshift.
Redshift Serverless, Materialized Views avançadas (PIT/bridges em Business Vault), RLS/CLS prático.
Segurança e compliance: Lake Formation fine-grained, tagging, mascaramento dinâmico.
Scala/Spark estruturado, Polars/Pandas para utilitários, Airflow avançado.

ETAPAS DO PROCESSO:

Inscrição
Fit cultural
Entrevista técnica
Entrevista com o cliente
Contratação

*Nota: é fundamental garantir que não haja conflitos de interesse ou vínculos que possam comprometer a confidencialidade ou a imparcialidade. Esse critério será observado desde o início do processo seletivo.

Engenheiro(a) de Dados SR