Engenheiro(a) de Dados Sênior100% Remoto | CLT Estamos em busca de um(a) Engenheiro(a) de Dados para atuar em um ambiente robusto de dados, com foco em construção e evolução de pipelines em larga escala, integração de múltiplas fontes e processamento distribuído em cloud.O que você vai fazer:Desenvolver e manter pipelines de dados com PySparkOrquestrar workflows com Apache Airflow (DAGs em Python)Trabalhar com processamento distribuído em ambiente AWS (EMR)Integrar dados de diferentes fontes, incluindo APIsAtuar na ingestão, transformação e disponibilização de dadosGarantir qualidade, performance e escalabilidade dos pipelinesO que buscamos:Experiência com PySpark (Spark + Python)Vivência com Airflow (criação/manutenção de DAGs)Experiência com ScalaExperiência com APIsExperiência com AWS (especialmente EMR, S3, Glue)SQL sólido para manipulação de dadosVivência com notebooks (Jupyter ou similares)Diferenciais:Experiência com arquitetura de dados (Data Lake / Lakehouse)Vivência em ambientes de alto volume (Big Data)Perfil comportamental:Buscamos alguém com boa comunicação, autonomia e perfil consultivo, já que terá interação direta com o cliente.