Observabilidade e Instrumentação de Aplicações
Ambiente baseado em AWS, Kubernetes, troubleshooting de workloads e ecossistema CNCF são fundamentais para garantir serviços monitoráveis e confiáveis com desempenho previsível.
* Apoie iniciativas de observabilidade ampliando métricas, logs, traces e dashboards que direcionem ações de negócio e operacionais;
* Instrumente aplicações em conjunto com equipes de produto e desenvolvimento utilizando SDKs/libs (Datadog ou OpenTelemetry);
* Apoie os times na definição e acompanhamento de SLOs, SLIs e SLAs;
* Investigue e resolva gargalos de performance e disponibilidade atuando junto aos times de engenharia durante troubleshooting;
* Sustente e evolua as plataformas de observabilidade e monitoramento da companhia;
* Fortaleça a cultura de confiabilidade e observabilidade disseminando boas práticas e documentação;
* Participe de decisões arquiteturais garantindo resiliência escalabilidade e alta disponibilidade dos serviços.
Habilidades e Competências
* Experiencia solidada em projetos de observabilidade e instrumentacao de aplicacoes (Datadog, OpenTelemetry);
* Vivencia com ambientes baseados em AWS;
* Forte conhecimento em Kubernetes, troubleshooting de workloads e ecossistema CNCF;
* Conhecimento pratico em linguagens de programacao como Go, Ruby, Python ou Node.js;
* Entendimento de arquitetura distribuida, padrões de resiliência e performance.