O profissional será responsável por criar pipelines de transformação de dados em AWS Glue, tendo como base os requisitos de negócio e implementando jobs de transformação com PySpark. Os datasets resultantes serão armazenados em S3 e orquestrados automatizados via Step Functions e infraestrutura versionada em Git e Terraform.
O principal conjunto de tecnologias inclui: AWS Glue, PySpark, S3, Step Functions, EventBridge, Athena, Kinesis e Terraform.