Profissional para construir e escalar pipelines em Databricks/Spark na AWS, suportando iniciativas de AI/ML e projetos de analytics/BI, em colaboração com times globais.
Principais atividades:
Projetar, desenvolver e otimizar pipelines em Databricks/Spark (batch/streaming) com qualidade, performance e observabilidade.
Integrar e orquestrar dados na AWS (S3, Glue, Athena/Redshift), garantindo governança e segurança.
Construir datasets e pipelines para AI/ML (feature engineering, dados para treino e inferência).
Atender demandas end-to-end de dados para produtos e BI (ingestão, transformação e disponibilização).
Requisitos:
Domínio de Databricks e Apache Spark em produção.
Experiência prática com a stack AWS para dados/analytics.
Forte base em SQL e Python, com boas práticas de versionamento e CI/CD de dados.
Inglês avançado/fluente para reuniões com times globais.
Informações adicionais:
Atuação remota
Contratação CLT