Sobre a vaga:
A Dimensa está no topo do jogo quando o assunto é tecnologia e infraestrutura para operações financeiras, crédito e risco, e seguros.
Nossos sistemas são super escaláveis e adaptáveis, perfeitos para negócios de todos os tamanhos.
Nossa equipe de experts vive e respira o setor financeiro, atualizando nossas soluções constantemente para tornar suas operações mais digitais, melhorar a performance, inovar no atendimento aos clientes e garantir que todas as exigências regulatórias sejam 100% cumpridas.
Todas as nossas oportunidades são inclusivas e abertas para pessoas com deficiência.
O DESAFIO:
? Planejar, implantar e manter a infraestrutura necessária para o pipeline de dados, incluindo servidores, containers ou clusters (por exemplo, configuração de clusters Spark/Databricks, instâncias de banco de dados PostgreSQL, clusters MongoDB e brokers Kafka), seja em ambiente de nuvem ou on-premises, garantindo configurações adequadas de alta disponibilidade e redundância.
? Desenvolver e gerenciar pipelines de CI/CD para automação de deploy das aplicações e componentes de dados (serviços Java, notebooks Databricks, configurações de bancos), promovendo entregas constantes e confiáveis sem interrupção do serviço.
? Implementar soluções de monitoramento, logging e alerta para todos os componentes da plataforma (uso de ferramentas como Prometheus/Grafana, ELK Stack ou equivalentes), garantindo observabilidade completa do sistema (métricas de performance, falhas, latências, utilização de recursos) e resposta rápida a incidentes.
? Trabalhar junto aos engenheiros de dados e desenvolvedores para melhorar a confiabilidade das aplicações, revisando configurações, identificando pontos únicos de falha e implementando soluções de resiliência (como balanceamento de carga, retries automáticos, fallback).
? Gerenciar a segurança e conformidade da infraestrutura, aplicando atualizações de sistema, patches de segurança, configurações de firewall e acessos apropriados, em alinhamento com políticas corporativas e requisitos (por exemplo, LGPD).
? Otimizar a performance e custo da infraestrutura, monitorando uso de recursos e escalando ambientes conforme necessidade (vertical ou horizontalmente), bem como implementando rotinas de housekeeping (expurgo de logs, archiving de dados) para manter o ambiente saudável.
? Liderar a resposta a incidentes críticos relacionados à infraestrutura ou disponibilidade dos sistemas de dados, investigando raiz de problemas (post- mortem) e implementando ações preventivas para evitar recorrências.
O QUE VOCÊ PRECISA:
? Domínio de sistemas operacionais Linux e competências em automação de infraestrutura (shell scripting, Python) e infraestrutura como código (Terraform, CloudFormation ou similares).
? Conhecimento sólido em ferramentas de containerização e orquestração (Docker, Kubernetes) para gerir serviços containerizados e escalar aplicações.
? Experiência com plataformas de nuvem (AWS, Azure ou GCP) ou com ambientes virtualizados on-premises, compreendendo rede, armazenamento e computação, e habilidade para configurar serviços como bancos de dados gerenciados, balanceadores de carga, etc.
? Prática em configurar e manter ferramentas de monitoramento e logging (Prometheus, Grafana, ELK, CloudWatch, etc.) e interpretar métricas para troubleshooting.
? Familiaridade com conceitos de SRE, incluindo definição de SLOs/SLAs, error budget, e experiência em protocolos de resposta a incidentes.
VOCÊ VAI BRILHAR AINDA MAIS SE TIVER:
Experiência no mercado financeiro
O QUE OFERECEMOS PARA VOCÊ:
? Vale Refeição/Vale Alimentação (flexível)
Assistência Médica