Responsabilidades
Operar e evoluir clusters Amazon EKS com workloads de dados e ML: JupyterHub, MLflow, Airflow e similares
Criar e manter módulos Terraform reutilizáveis para padronizar a infraestrutura entre squads
Construir e manter esteiras CI/CD no GitHub Actions cobrindo múltiplos ambientes com isolamento completo
Atuar na governança AWS multi-account: IAM com least privilege, segurança de redes e controle de acesso
Construir e manter pipelines de dados com Glue, Lambda e S3
Participar das decisões de arquitetura da plataforma trazendo a visão de infraestrutura e custo operacional
Acompanhar custos via FinOps e propor otimizações de workloads
Requisitos
Experiência sólida com Amazon EKS em contexto de dados ou MLOps — workloads como Jupyter, MLflow, Airflow rodando em cluster é o diferencial que mais importa aqui
Terraform no dia a dia — criação de módulos do zero, não só aplicação
AWS com profundidade em ecossistema de dados: Glue, Lambda, S3, IAM avançado, multi-account
GitHub Actions ou ferramenta similar para CI/CD
Perfil de alta autonomia — você vai construir junto, não executar tarefas