Conhecendo a TAG
Somos uma empresa de tecnologia, uma Infraestrutura do Mercado Financeiro (IMF), autorizada e regulada pelo Banco Central. Viabilizamos a gestão de ativos através de plataformas e ferramentas modernas e inovadoras.
Nosso foco é desenvolver soluções eficazes para os mercados de pagamento, crédito e financeiro do Brasil.
De sub-credenciadoras a bancos, criamos uma estrutura robusta e flexível para atender diferentes tipos de operações.
Aqui, você irá trabalhar com um time apaixonado por desafios, focado no cliente e em busca dos melhores resultados em suas entregas. Quer mais? Tudo isso de forma 100% remota, em home office e com uma galera que é referência no mercado de tecnologia!
Como é ser uma pessoa Site Reliability Engineer Júniorno nosso time:
Ser um(a)
Site Reliability Engineer
no nosso time significa atuar no centro da nossa operação de monitoramento e observabilidade, garantindo que os sistemas e serviços estejam sempre disponíveis, estáveis e confiáveis. Esse papel exige profundidade técnica, visão estratégica e capacidade de resposta rápida em momentos críticos. No dia a dia, você será um(a) especialista em Datadog, criando, refinando e mantendo monitoramentos inteligentes, métricas estratégicas e dashboards que fornecem visibilidade total da saúde dos sistemas. Também terá papel central na gestão de incidentes, conduzindo war rooms, investigando causas-raiz e propondo soluções que previnam recorrências.Sua atuação na gestão de alertas será essencial para reduzir falsos positivos, ajustar thresholds e otimizar a eficiência de resposta. Na área de observabilidade, garantirá que tenhamos dados confiáveis e insights acionáveis para tomada de decisão rápida, conectando métricas, logs e traces de forma integrada.
O que esperamos de você:
• Atuar no coração da operação, com foco em monitoramento, observabilidade e gestão de incidentes.
• Criar e otimizar alertas no Datadog, dashboards e métricas.
• Garantir observabilidade ponta a ponta, conectando métricas, logs e traces.
• Trabalhar lado a lado com times de desenvolvimento, infraestrutura e negócio para prevenir problemas antes que eles ocorram.
• Experiência em Datadog (alertas, dashboards, métricas, logs, traces, watchdog e anomaly detect ).
• Práticas de observabilidade e otimização de alertas.
• Conhecimento em ITIL (incident, problem, event management).
• Experiência com arquiteturas distribuídas/microserviços (cloud, containers, Kubernetes como diferencial).
• Senso de urgência e resiliência em situações críticas.
• Comunicação clara e objetiva.
• Pensamento analítico e mentalidade de dono.
• Proatividade e espírito colaborativo.
O que aumentam suas chances:
• Uso de IA e Machine Learning no Datadog para prever e correlacionar incidentes.
• Automação com Python ou outra linguagem para criar scripts, integrações e relatórios.
• Experiência com playbooks automatizados para resposta a incidentes.
#
Como é o processo seletivo:
Nosso foco está na história e trajetória das nossas pessoas candidatas. Por isso, temos alguns papos ao longo do processo, nos quais você conhecerá referências técnicas e culturais do nosso time!
# Quer saber os benefícios que oferecemos? A gente te conta!
• Contração CLT
• Assistência médica e odontológica
• Seguro de vida
• Vale alimentação
• Vale refeição
• Auxílio remoto
• Gympass
CURTIU? :)
Então se inscreva aí! #VemSerTAG