Caro usuário, habilite o javascript para que esse site funcione corretamente.

Engenheiro(a) de Dados SR

* Salário: R$ 11.000 a R$ 20.000 por mês (estimado)

* O valor exibido é uma estimativa calculada com base em dados públicos e referências do mercado. Não garantimos que este seja o salário oferecido para esta vaga específica.

Área: Tecnologia da Informação

Nível: Senior

Somos ávidos por tecnologia, criatividade e desafios.

Se você gosta de desafios, aprendizado constante e valoriza as conexões pessoais, junte-se a nós!

# Valorizamos a diversidade e acreditamos que ela é fundamental para a inovação e entregas de valor aos nossos clientes. Todas as nossas vagas são destinadas a todas as pessoas, com ou sem deficiência, independentemente de idade, gênero, orientação sexual, etnia, religião ou qualquer outra característica. Se você se identifica com a posição, venha fazer parte do nosso time!

O QUE BUSCAMOS?

Buscamos um(a) Engenheiro(a) de Dados, em níveis de carreira Sênior, que queiram trabalhar conosco em um ambiente descontraído e dinâmico, com aprendizado contínuo no desenvolvimento de grandes projetos, junto a grandes clientes nacionais e internacionais. Temos escritórios em São Paulo e Chicago (EUA), mas a nossa atuação é remota: por aqui preferimos chamar de anywhere office.

O QUE ESSE PROFISSIONAL IRÁ FAZER?

  • Projetar e implementar pipelines de dados escaláveis usando AWS Glue/Spark, Step Functions, Lambda, EMR e integrações.
  • Modelar e otimizar Data Lake/Lakehouse.
  • Administrar e tunar Amazon Redshift (sort/dist keys, WLM/Auto WLM, RA3, Concurrency Scaling, materialized views, Spectrum, UNLOAD/COPY, late-binding views).
  • Garantir qualidade de dados e observabilidade.
  • Implementar governança e segurança (Lake Formation, IAM least-privilege, KMS, RLS/CLS, mascaramento, auditoria).
  • Automatizar infraestrutura com IaC (Terraform), CI/CD (GitHub Actions/GitLab CI), versionamento e revisão de código.
  • Realizar code reviews criteriosos (legibilidade, padrões, testes, custos/performance), além de mentorar o time para elevar a barra técnica.
  • Trabalhar com times de produto, analytics e ciência de dados para disponibilizar datasets confiáveis e bem documentados (dbt/Docs, data contracts, lineage).
  • Otimizar custo/performance continuamente (storage tiers, workload management, caching, compressão, layout físico, vacuum/maintenance).

O QUE É NECESSÁRIO PARA A POSIÇÃO?

  • Experiência sólida em AWS com foco prático em Redshift e S3.
  • Vivência com ETL/ELT usando AWS Glue (PySpark) e/ou EMR/Spark; orquestração com Step Functions ou Airflow.
  • Domínio de SQL avançado (window functions, CTEs, otimização de queries) e noções de modelagem dimensional (Star/Snowflake) e/ou Data Vault.
  • Conhecimentos de formato columnar, particionamento por data/chaves, Glue Catalog/Athena.
  • Boas práticas de segurança (IAM/KMS), monitoramento (CloudWatch) e logging.
  • Python (Pandas/PySpark) para jobs e utilitários; Lambda (Serverless).
  • Domínio de Git e pipelines de CI/CD.
  • Comunicação clara, mentalidade de dono(a) e foco em entrega com qualidade.
  • Inglês técnico.

O QUE SERIA UM DIFERENCIAL?

  • dbt (tests, docs, exposures) e data lineage.
  • Lakehouse com Apache Iceberg/Delta/Hudi; Athena/Spectrum avançado e Redshift Spectrum bem estruturado.
  • Qualidade de dados com Great Expectations ou Deequ; contratos de esquema (Avro/Protobuf), Schema Registry.
  • FinOps aplicado a dados (custo por workload, chargeback/showback, otimização de armazenamento/transferência).
  • Observabilidade: CloudWatch Logs/ Metrics, OpenTelemetry, QMRs no Redshift.
  • Redshift Serverless, Materialized Views avançadas (PIT/bridges em Business Vault), RLS/CLS prático.
  • Segurança e compliance: Lake Formation fine-grained, tagging, mascaramento dinâmico.
  • Scala/Spark estruturado, Polars/Pandas para utilitários, Airflow avançado.

ETAPAS DO PROCESSO:

  1. Inscrição
  2. Fit cultural
  3. Entrevista técnica
  4. Entrevista com o cliente
  5. Contratação

*Nota: é fundamental garantir que não haja conflitos de interesse ou vínculos que possam comprometer a confidencialidade ou a imparcialidade. Esse critério será observado desde o início do processo seletivo.