Modelo de trabalho:
Híbrido – São Paulo (2x por semana)
Contratação:
CLT
Profissional com sólida experiência em
observabilidade e monitoramento de sistemas complexos
, atuando como referência técnica na implementação, manutenção e evolução de soluções de
monitoramento de desempenho de aplicações (APM)
, com foco em
AppDynamics
.
Deve possuir conhecimento avançado em
arquiteturas distribuídas
,
microserviços
e
ambientes cloud-native (AWS, Azure, GCP)
, com forte capacidade analítica para
identificar gargalos de desempenho
, conduzir
análises de causa raiz (RCA)
e propor
melhorias contínuas
na experiência digital dos usuários finais.
Responsabilidades e atribuições
* Liderar a implementação, sustentação e evolução da plataforma de observabilidade com foco em
AppDynamics
.
* Trabalhar em parceria com equipes de
desenvolvimento, infraestrutura e SRE
, garantindo
visibilidade ponta a ponta
das aplicações e serviços.
* Desenvolver e manter
dashboards e painéis de observabilidade
orientados ao negócio (BTO –
Business Transaction Observability
).
* Conduzir
análises de performance
em aplicações críticas, sugerindo melhorias em arquitetura e/ou código.
* Atuar na
prevenção de incidentes
com base em dados e tendências coletadas nas ferramentas de observabilidade.
* Apoiar a
gestão de incidentes críticos
, participar de
war rooms
e realizar análises pós-incidente (
post-mortem
).
* Garantir a
documentação técnica
e disseminar
boas práticas
de observabilidade e monitoramento.
Requisitos e qualificações
* AppDynamics (nível avançado):
instalação, configuração, tuning, desenvolvimento de dashboards customizados, criação de alertas proativos, análises de
business transactions
e
snapshots
de performance.
* Ferramentas de Observabilidade:
integração com soluções como
Splunk
,
Elastic Stack
,
Grafana
,
Prometheus
,
Dynatrace
,
Datadog
, entre outras.
* DevOps / SRE:
atuação em times multidisciplinares com cultura DevOps; experiência com
CI/CD
(Jenkins, GitLab CI) e
Infrastructure as Code
(Terraform, Ansible).
* Cloud:
monitoramento de workloads em
AWS
,
Azure
e/ou
GCP
.
* Logs e Métricas:
ingestão, correlação e análise em tempo real.
* Scripting / Programação:
conhecimento em
Python
,
Bash
e
PowerShell
para automações e integrações.
* ITSM e Gestão de Incidentes:
experiência em suporte a incidentes críticos e melhoria contínua de processos.
Formação e Certificações Desejáveis
* Graduação em
Ciência da Computação
,
Engenharia
,
Sistemas de Informação
ou áreas correlatas.
* Certificações desejáveis:
* AppDynamics Certified Associate / Professional / Expert
* Certificações Cloud
(AWS, Azure, GCP)
* Certificações DevOps
e/ou
SRE