O profissional deve garantir a qualidade, consistência e integridade dos dados em larga escala. Isso envolve a manutenção de pipelines escaláveis e confiáveis, implementação de processos de Data Care e garantia da qualidade dos dados por meio de testes automatizados e validações.
Responsabilidades
* Desenvolver, manter e otimizar pipelines de dados para coletar e consumir dados eficientemente;
* Implementar processos de Data Care, incluindo monitoramento, limpeza, catalogação, versionamento e reconciliação de dados;
* Garantir a qualidade dos dados por meio de testes automatizados, validações e auditorias de integridade;
* Trabalhar com times de Engenharia, Analytics e Produto para estruturar a coleta e o consumo eficiente de dados;
* Audit data lineage, data catalog e definição de políticas de governança;
* Monitorar e resolver falhas de ingestão e transformação de dados;
* Documentar os processos técnicos em conjunto com arquitetura, processos e padrões de engenharia de dados;
* Apoiar a implantação de melhores práticas de segurança e compliance de dados.
Conhecimento Técnico Requerido
* Experiência robusta em Data Care para garantir a qualidade, consistência, integridade e governança dos dados em larga escala;
* Experiência sólida com ferramentas de engenharia de dados como Spark, Airflow, Hadoop e outras;
* Forte conhecimento em SQL e linguagens como Python ou Scala;
* Vivência com Data Quality Frameworks e ferramentas de observabilidade de dados;
* Experiência com Data Governance, Data Catalog, Data Lineage;
Benefícios
* Assistência médica;
* VR e VA flexível;
* Gympass e Wellz;
* Parceria com o SESC;
* Descontos em restaurantes;
* Descontos em cursos técnicos e de ensino superior;
* Descontos em escolas e plataformas de idiomas.