 
        
        Encontramos profissionais apaixonados por educação e tecnologia, que atuam em um ambiente de alto desempenho exigindo união de múltiplas competências e experiências.
O nosso foco é deixar o nosso legado no mundo. Nós queremos conectar essas paixões com as necessidades do negócio
Demandas da Função
 * Ser responsável pela definição de SLOs, SLIs e dashboards de criticidade para garantir a integridade dos nossos sistemas
 * Estruturar estratégias de resiliência (circuit breaking, graceful degradation, fail-over) para minimizar a exposição aos riscos
 * Desenhar e evoluir padrões de infraestrutura cloud-native para apoiar a escalabilidade e a flexibilidade
 * Automatizar provisionamento via IaC e garantir controles de segurança/compliance com Policy-as-Code para garantir a conformidade regulamentar
 * Orquestrar incident response end-to-end (alertas, on-call, blameless post-mortems) para reduzir o tempo de recuperação dos incidentes
 * Padrornizar coleta de métricas, traces e logs para fornecer visibilidade sobre os processos
 * Construir playbooks de resposta a incidentes para garantir uma abordagem coordenada e eficaz
 * Evoluir pipelines de CI/CD para melhorar a agilidade e a confiabilidade das entregas
 * Implantar políticas de qualidade e SSDLC para garantir a sustentabilidade e a Governança das operações
 * Orquestrar progressive delivery (blue/green, canary, feature flags) com rollback automático guiado por métricas de impacto para minimizar os riscos de mudanças
 * Modelar topologias em nuvem (Transit Gateway, VPC Peering, Service Mesh) para otimizar a rede e a conectividade
 * Especificar controles Zero-Trust, microsegmentação de rede e requisitos IPv6 para garantir a segurança dos dados
Habilidades Exigidas:
 * Fundamental conhecimento em Cloud: Kubernetes, IaC (Terraform/Pulumi), serviços gerenciados AWS/Azure/GCP
 * Disponibilidade para workshops, brown-bags, documentação arquitetural (ADR, C4)
 * Fluência em modelos de governança: CNCF, CIS, OWASP SAMM, Well-Architected
 * Comunicação efetiva em inglês (conversação técnica com fornecedores)
Avaliamos como positivas habilidades adicionais como:
 * Estruturar estratégias de replicação, sharding e Disaster Recovery (PITR, cross-region) para garantir a redundância e a alta disponibilidade
 * Governar versionamento de esquema e migrações para manter a consistência e a integridade dos dados
 * Implementar observabilidade de performance e capacity planning para otimizar a infraestrutura e a utilização dos recursos
 * Definir reference architectures (SPA, PWA, Clean Architecture) para estabelecer diretrizes claras para as soluções de software
 * Aprovar guidelines de design system, acessibilidade e performance para garantir a qualidade e a usabilidade das interfaces de usuário
 * Desenhar APIs (REST/GraphQL/gRPC) e microsserviços resilientes para proporcionar interoperabilidade e flexibilidade nos sistemas
 * Padronizar contratos de eventos (Avro/AsyncAPI) para facilitar a comunicação entre os sistemas
 * Definir pirâmide de testes, métricas de cobertura e shift-left security para garantir a qualidade e a segurança dos sistemas
 * Introduzir testes de carga orientados a SLOs para avaliar a capacidade de suporte à demanda dos sistemas
 * Projetar e operar pipelines de ingestão batch e streaming para fornecer dados precisos e atualizados
 * Definir arquitetura lakehouse (S3 + Delta/Iceberg) com modelagem medallion/star para armazenar e analisar dados
 * Estabelecer data quality, lineage e governança para garantir a consistência e a integridade dos dados
 * Otimizar custos de armazenamento/compute (partition pruning, serverless analytics) para maximizar a eficiência dos recursos