Conhecendo a TAG 💙
Somos uma empresa de tecnologia, uma Infraestrutura do Mercado Financeiro (IMF), autorizada e regulada pelo Banco Central. Viabilizamos a gestão de ativos através de plataformas e ferramentas modernas e inovadoras.
Nosso foco é desenvolver soluções eficazes para os mercados de pagamento, crédito e financeiro do Brasil.
De sub-credenciadoras a bancos, criamos uma estrutura robusta e flexível para atender diferentes tipos de operações.
Aqui, você irá trabalhar com um time apaixonado por desafios, focado no cliente e em busca dos melhores resultados em suas entregas. Quer mais? Tudo isso de forma 100% remota, em home office e com uma galera que é referência no mercado de tecnologia!
Como é ser uma pessoa Site Reliability Engineer Júniorno nosso time:
Ser um(a) Site Reliability Engineer no nosso time significa atuar no centro da nossa operação de monitoramento e observabilidade, garantindo que os sistemas e serviços estejam sempre disponíveis, estáveis e confiáveis. Esse papel exige profundidade técnica, visão estratégica e capacidade de resposta rápida em momentos críticos. No dia a dia, você será um(a) especialista em Datadog, criando, refinando e mantendo monitoramentos inteligentes, métricas estratégicas e dashboards que fornecem visibilidade total da saúde dos sistemas. Também terá papel central na gestão de incidentes, conduzindo war rooms, investigando causas-raiz e propondo soluções que previnam recorrências.Sua atuação na gestão de alertas será essencial para reduzir falsos positivos, ajustar thresholds e otimizar a eficiência de resposta. Na área de observabilidade, garantirá que tenhamos dados confiáveis e insights acionáveis para tomada de decisão rápida, conectando métricas, logs e traces de forma integrada.
O que esperamos de você:
- Atuar no coração da operação, com foco em monitoramento, observabilidade e gestão de incidentes.
- Criar e otimizar alertas no Datadog, dashboards e métricas.
- Garantir observabilidade ponta a ponta, conectando métricas, logs e traces.
- Trabalhar lado a lado com times de desenvolvimento, infraestrutura e negócio para prevenir problemas antes que eles ocorram.
- Experiência em Datadog (alertas, dashboards, métricas, logs, traces, watchdog e anomaly detect ).
- Práticas de observabilidade e otimização de alertas.
- Conhecimento em ITIL (incident, problem, event management).
- Experiência com arquiteturas distribuídas/microserviços (cloud, containers, Kubernetes como diferencial).
- Senso de urgência e resiliência em situações críticas.
- Comunicação clara e objetiva.
- Pensamento analítico e mentalidade de dono.
- Proatividade e espírito colaborativo.
O que aumentam suas chances:
- Uso de IA e Machine Learning no Datadog para prever e correlacionar incidentes.
- Automação com Python ou outra linguagem para criar scripts, integrações e relatórios.
- Experiência com playbooks automatizados para resposta a incidentes.
# Como é o processo seletivo:
Nosso foco está na história e trajetória das nossas pessoas candidatas. Por isso, temos alguns papos ao longo do processo, nos quais você conhecerá referências técnicas e culturais do nosso time!
# Quer saber os benefícios que oferecemos? A gente te conta!
- Contração CLT
- Assistência médica e odontológica
- Seguro de vida
- Vale alimentação
- Vale refeição
- Auxílio remoto
- Gympass
CURTIU? :
)
Então se inscreva aí! #VemSerTAG