Desenvolvedor de Observabilidade
O candidato ideal para o cargo de Desenvolvedor de Observabilidade será responsável por liderar a implementação e evolução da plataforma de observabilidade, consolidando logs, métricas e traces.
Essa pessoa deve ser capaz de definir, padronizar e manter painéis e alertas para serviços críticos da organização, estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs) e orientar decisões técnicas com base em dados.
Além disso, ela deve automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas, atuar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua.
O candidato deve ter experiência sólida e comprovada como SRE, Observability Engineer ou DevOps com foco em monitoramento, domínio técnico de Zabbix, Elastic Stack e Dynatrace em ambientes de missão crítica.
Ela também deve ter forte entendimento de arquitetura de sistemas distribuídos e métricas operacionais, vivência com rastreamento distribuído e integração de logs/métricas em pipelines CI/CD, capacidade de correlacionar dados de observabilidade com impacto no negócio e fluência em automação com linguagens como Python, Shell Script, Go ou similares.
Habilidades Requisitadas:
1. Experiência em monitoramento e tratamento de logs, métricas e traces;
2. Domínio de ferramentas como Zabbix, Elastic Stack e Dynatrace;
3. Conhecimento de arquitetura de sistemas distribuídos e métricas operacionais;
4. Vivência com rastreamento distribuído e integração de logs/métricas em pipelines CI/CD;
5. Capacidade de correlacionar dados de observabilidade com impacto no negócio;
6. Fluência em automação com linguagens como Python, Shell Script, Go ou similares;
Vantagens:
7. Oportunidade de trabalhar em um ambiente dinâmico e desafiador;
8. Acompanhamento contínuo de desenvolvimento e melhorias;
We are looking for an Observability Developer to lead the implementation and evolution of our observability platform, consolidating logs, metrics, and traces. The ideal candidate will be responsible for defining, standardizing, and maintaining dashboards and alerts for critical services in the organization, establishing and following reliability indicators (SLIs, SLOs), and guiding technical decisions based on data. In addition, they must automate alert responses and reduce toil through scripting and integration between tools, manage incidents: triage, resolution coordination, documentation, and continuous improvement. The candidate must have solid and proven experience as SRE, Observability Engineer, or DevOps with focus on monitoring, technical expertise in Zabbix, Elastic Stack, and Dynatrace in mission-critical environments. They should also have a strong understanding of distributed system architecture and operational metrics, experience with distributed tracking and log/metric integration in CI/CD pipelines, ability to correlate observability data with business impact, and proficiency in automation with languages like Python, Shell Script, Go, or similar.