Oportunidade | Engenheiro(a) de Dados (Sênior) 100% Remoto | CLT Estamos em busca de um(a) Engenheiro(a) de Dados para atuar em um ambiente robusto de dados, com foco em construção e evolução de pipelines em larga escala, integração de múltiplas fontes e processamento distribuído em cloud. O que você vai fazer: Desenvolver e manter pipelines de dados com PySpark Orquestrar workflows com Apache Airflow (DAGs em Python) Trabalhar com processamento distribuído em ambiente AWS (EMR) Atuar na ingestão, transformação e disponibilização de dados Garantir qualidade, performance e escalabilidade dos pipelines O que buscamos: Experiência com PySpark (Spark + Python) Vivência com Airflow (criação/manutenção de DAGs) Experiência com AWS (especialmente EMR, S3, Glue) SQL sólido para manipulação de dados Vivência com notebooks (Jupyter ou similares) Diferenciais: Integrar dados de diferentes fontes, incluindo APIs Conhecimento em Scala Experiência com arquitetura de dados (Data Lake / Lakehouse) Vivência em ambientes de alto volume (Big Data) Perfil comportamental: Buscamos alguém com boa comunicação, autonomia e perfil consultivo, já que terá interação direta com o cliente.