/n
* Experiência sólida com Python para engenharia de dados: ETL/ELT, orquestração (Airflow, Prefect ou equivalentes), frameworks de transformação (dbt, Spark ou equivalentes);
* SQL avançado: modelagem dimensional, window functions, otimização de queries em ambientes distribuídos;
* Conhecimento em arquiteturas de Data Lake/Lakehouse e suas implicações de particionamento, formato (Parquet, Delta, Iceberg) e catálogo de dados;
* Experiência com plataformas de streaming e eventos: Kafka, Kinesis ou equivalentes;
* Familiaridade com ferramentas de qualidade e observabilidade de dados (Great Expectations, Monte Carlo ou equivalentes);
* Capacidade de documentar decisões arquiteturais com clareza e rastrear impactos de mudança no ecossistema de dados.
/n
* Projetar e implementar pipelines de ingestão, transformação e disponibilização de dados em arquiteturas modernas (Data Lake, Lakehouse, camadas Bronze/Silver/Gold ou equivalentes);
* Conduzir a migração de cargas e modelos de BI tradicional para ambientes modernos, preservando rastreabilidade e garantindo qualidade dos dados;
* Desenvolver soluções em Python e SQL com foco em manutenibilidade, testabilidade e performance;
* Integrar fontes de dados via arquiteturas orientadas a eventos (Kafka ou equivalentes), garantindo baixa latência e consistência;
* Definir e documentar padrões de modelagem, qualidade e governança de dados para adoção pelo time;
* Colaborar com engenheiros de software, cientistas de dados e times de produto para garantir que os dados entregues sejam corretos, confiáveis e utilizáveis.