Procuramos profissionais de alta qualidade para atuar em projetos complexos relacionados a dados.
Necessidades Fundamentais
* A experiência previa com o ecossistema AWS é essencial para garantir o sucesso no projeto.
* Desenvolvedores competentes que podem planejar, implementar e manter pipelines de dados escaláveis e eficientes devem ser considerados.
Competências Técnicas Específicas:
* AWS Glue – criação e manutenção de jobs, crawlers, catálogos de dados, e integração com outros serviços AWS.
* Apache Airflow – orquestração de workflows ETL/ELT, agendamento e monitoramento de pipelines.
* Python – desenvolvimento de scripts e automações para tratamento e transformação de dados.
* PySpark – processamento distribuído de grandes volumes de dados, otimização de jobs e tuning de performance.
* Amazon Athena – criação e otimização de consultas SQL serverless, integração com S3 e Glue Data Catalog.
* Amazon S3 – modelagem de buckets, organização de dados brutos e tratados, versionamento e políticas de acesso.
* AWS Lambda – funções serverless para processamento em tempo real, automações e integrações.
* Amazon EMR – administração e execução de clusters Hadoop/Spark, configuração de ambientes e pipelines de alto desempenho.
* Git e CI/CD – versionamento de código, integração e entrega contínua, configuração de pipelines de deploy (GitHub Actions, CodePipeline ou similares).
Habilidades Complementares Desejadas:
* Modelagem de dados – entendimento de estruturas dimensionais, relacionais e não relacionais, normalização/desnormalização e boas práticas para ambientes analíticos.
* ETL/ELT – levantamento de requisitos, desenho e implementação de fluxos de extração, transformação e carga, com foco em qualidade e governança.
* Boas práticas de segurança e compliance no ecossistema AWS (IAM, KMS, políticas de acesso, criptografia).
* Integração de dados provenientes de múltiplas fontes (bancos relacionais, APIs, arquivos, streams).
* Monitoramento e observabilidade de pipelines (CloudWatch, logs, métricas e alertas).
* Documentação técnica clara e manutenção de repositórios de conhecimento.
Diferenciais Importantes:
* Conhecimento básico/intermediário de espanhol para interação com times ou clientes hispano-falantes.
* Experiência com ambientes multi-conta e multi-região na AWS.
* Familiaridade com infraestrutura como código (CloudFormation, Terraform ou CDK).
* Experiência em otimização de custos em workloads de dados na nuvem.