Buscamos um Especialista em Datadog com sólida experiência em observabilidade, integrações de serviços e automação de fluxos operacionais, atuando de forma integrada com Jira e Power Automate. Este profissional será responsável por desenhar, implementar e sustentar soluções que conectem eventos de monitoramento a processos de ITSM, SRE e Governança, promovendo eficiência operacional, redução de incidentes e melhoria contínua.
Principais Responsabilidades
- Projetar, implementar e manter dashboards, monitores e alertas no Datadog, alinhados a SLAs, SLOs e KPIs de negócio.
- Desenvolver e sustentar integrações entre Datadog e Jira, automatizando:
- Criação, atualização e encerramento de tickets.
- Enriquecimento de incidentes com contexto técnico.
- Correlação entre eventos, incidentes e problemas.
- Criar fluxos automatizados no Power Automate para:
- Orquestrar ações a partir de alertas do Datadog.
- Integrar sistemas adicionais (ex.: ServiceNow, Teams, e-mail, APIs REST).
- Padronizar respostas a incidentes e processos operacionais.
- Trabalhar em conjunto com times de SRE, DevOps, Infraestrutura e Aplicações, garantindo observabilidade ponta a ponta.
- Definir e manter boas práticas de observabilidade, incluindo logs, métricas, traces e eventos.
- Apoiar iniciativas de automação operacional, governança e FinOps, utilizando dados do Datadog para otimização de custos e capacidade.
- Documentar arquiteturas, fluxos de integração e procedimentos operacionais.
- Atuar no troubleshooting de integrações, identificando falhas e propondo melhorias contínuas.
- Apoiar em salas de crise, quando for necessário entender as métricas coletadas pelo Datadog.
Requisitos Técnicos Obrigatórios
- Experiência comprovada com Datadog, incluindo:
- Monitors, Dashboards, Logs, APM e integrações nativas.
- Experiência prática com integração Datadog ↔ Jira, utilizando:
- Webhooks, APIs REST e automações.
- Conhecimento sólido em Power Automate, incluindo:
- Criação de fluxos automatizados.
- Consumo e publicação de APIs.
- Manipulação de JSON, condições e controles.
- Conhecimento de ITSM, Incident Management e Observabilidade.
- Familiaridade com ambientes cloud (AWS, Azure ou GCP).
- Capacidade de leitura e escrita de documentação técnica.
Competências Comportamentais
- Forte capacidade analítica e orientação a dados.
- Comunicação clara com times técnicos e não técnicos.
- Organização e foco em processos.
- Proatividade na identificação de melhorias.
- Capacidade de trabalhar em ambientes críticos e de alta disponibilidade.

