Aqui, você trabalha com dados em massa usando PySpark, focando em SQL.
Desenvolva consultas complexas SQL para apoiar a lógica de negócios e necessidades de relatórios.
Entenda os requisitos autônoma e traduza para código.
Integre dados de diversas fontes em tabelas Iceberg e Snowflake.
Crie conjuntos de dados selecionados para consumo comercial.
Mantenha o relacionamento com analistas de negócios.
Orcusteie processos de dados no AWS EMR utilizando Airflow e serviços da AWS.
Garanta a qualidade dos dados em todo o pipeline.
* Foco em desenvolvimento de data marts
* Estruturação de pipelines de dados
* Gestão de projetos de dados