DevOps Engineer / Arquiteto de Infraestrutura (Foco em IA)
O Desafio
Estamos buscando um profissional de elite para liderar a arquitetura e a engenharia de plataforma da nossa operação. Você não será apenas um "executor de tickets", mas o Arquiteto responsável por desenhar e manter a espinha dorsal que suporta nossos modelos de Inteligência Artificial e sistemas de alta performance. Buscamos alguém que entenda que infraestrutura para IA vai muito além de subir máquinas virtuais. Precisamos de alguém que domine orquestração de GPUs, latência de inferência e pipelines de dados massivos.
O que você vai fazer (Responsabilidades)
Arquitetura de Alta Disponibilidade: Projetar, implementar e gerenciar infraestrutura cloud‑native (AWS/Azure/GCP) resiliente e escalável.
Infraestrutura para AI/ML: Gerenciar provisionamento de recursos de computação de alto desempenho (HPC/GPUs) e clusters Kubernetes otimizados para cargas de trabalho de IA.
MLOps & Automação: Construir e manter pipelines de CI/CD/CT (Continuous Training) para modelos de Machine Learning, utilizando ferramentas como Kubeflow, MLflow ou Ray.
Observabilidade: Implementar monitoramento avançado não apenas de infraestrutura (CPU/RAM), mas de métricas de modelo e drift de dados.
Performance Tuning: Otimizar o custo e a performance da nuvem, garantindo que o treinamento e a inferência dos modelos sejam eficientes.
Mentoria Técnica: Atuar como referência técnica para o time, elevando a barra de qualidade da engenharia.
Requisitos Obrigatórios (Hard Skills)
Domínio Absoluto de Kubernetes (K8s): conhecer as entranhas do K8s, otimizar, gerenciar CRDs, Operators e Helm Charts complexos.
IaC Avançado: Experiência profunda com Terraform, Ansible ou Pulumi.
Expertise em Cloud: Conhecimento avançado em redes, segurança e serviços gerenciados (EKS, AKS, GKE, SageMaker, Vertex AI).
Stack de AI/Data: Entendimento prático de como "produtizar" modelos. Experiência com servir modelos (Triton Inference Server, TorchServe) e Vector Databases (Milvus, Pinecone, Weaviate).
Programação: Sólida experiência em Python e Go (Golang) para automação e criação de ferramentas internas.
Linux Internals: Conhecimento profundo de SO, kernel tuning e networking.
Inglês
Diferenciais (O "Algo a Mais")
Experiência prévia em arquiteturas financeiras de baixa latência (HFT).
Conhecimento em estratégias de finops para GPUs (que são caras).
Contribuições para projetos Open Source.
Horário de Trabalho
Horário Comercial - Segunda a sexta feira.
Informações Adicionais
Disponibilidade de inicio imediato.
#J-18808-Ljbffr