Site reliability engineer júnior

Volta Redonda

TAG IMF

Anunciada dia 16 agosto

Descrição

Conhecendo a TAG 💙

Somos uma empresa de tecnologia, uma Infraestrutura do Mercado Financeiro (IMF), autorizada e regulada pelo Banco Central. Viabilizamos a gestão de ativos através de plataformas e ferramentas modernas e inovadoras.

Nosso foco é desenvolver soluções eficazes para os mercados de pagamento, crédito e financeiro do Brasil.

De sub-credenciadoras a bancos, criamos uma estrutura robusta e flexível para atender diferentes tipos de operações.

Aqui, você irá trabalhar com um time apaixonado por desafios, focado no cliente e em busca dos melhores resultados em suas entregas. Quer mais? Tudo isso de forma 100% remota, em home office e com uma galera que é referência no mercado de tecnologia!

Como é ser uma pessoa Site Reliability Engineer Júniorno nosso time:

Ser um(a) Site Reliability Engineer no nosso time significa atuar no centro da nossa operação de monitoramento e observabilidade, garantindo que os sistemas e serviços estejam sempre disponíveis, estáveis e confiáveis. Esse papel exige profundidade técnica, visão estratégica e capacidade de resposta rápida em momentos críticos. No dia a dia, você será um(a) especialista em Datadog, criando, refinando e mantendo monitoramentos inteligentes, métricas estratégicas e dashboards que fornecem visibilidade total da saúde dos sistemas. Também terá papel central na gestão de incidentes, conduzindo war rooms, investigando causas-raiz e propondo soluções que previnam recorrências.Sua atuação na gestão de alertas será essencial para reduzir falsos positivos, ajustar thresholds e otimizar a eficiência de resposta. Na área de observabilidade, garantirá que tenhamos dados confiáveis e insights acionáveis para tomada de decisão rápida, conectando métricas, logs e traces de forma integrada.

O que esperamos de você:

- Atuar no coração da operação, com foco em monitoramento, observabilidade e gestão de incidentes.

- Criar e otimizar alertas no Datadog, dashboards e métricas.

- Garantir observabilidade ponta a ponta, conectando métricas, logs e traces.

- Trabalhar lado a lado com times de desenvolvimento, infraestrutura e negócio para prevenir problemas antes que eles ocorram.

- Experiência em Datadog (alertas, dashboards, métricas, logs, traces, watchdog e anomaly detect ).

- Práticas de observabilidade e otimização de alertas.

- Conhecimento em ITIL (incident, problem, event management).

- Experiência com arquiteturas distribuídas/microserviços (cloud, containers, Kubernetes como diferencial).

- Senso de urgência e resiliência em situações críticas.

- Comunicação clara e objetiva.

- Pensamento analítico e mentalidade de dono.

- Proatividade e espírito colaborativo.

O que aumentam suas chances:

- Uso de IA e Machine Learning no Datadog para prever e correlacionar incidentes.

- Automação com Python ou outra linguagem para criar scripts, integrações e relatórios.

- Experiência com playbooks automatizados para resposta a incidentes.

# Como é o processo seletivo:

Nosso foco está na história e trajetória das nossas pessoas candidatas. Por isso, temos alguns papos ao longo do processo, nos quais você conhecerá referências técnicas e culturais do nosso time!

# Quer saber os benefícios que oferecemos? A gente te conta!

- Contração CLT

- Assistência médica e odontológica

- Seguro de vida

- Vale alimentação

- Vale refeição

- Auxílio remoto

- Gympass

CURTIU? :
)

Então se inscreva aí! #VemSerTAG

Se candidatar

Criar um alerta

Salvar