Engenheiro de dados

Guarapuava

Vagas Arthur

Anunciada dia 13 abril

Descrição

Engenheiro(a) de Dados Sênior

100% Remoto | CLT

Estamos em busca de um(a) Engenheiro(a) de Dados para atuar em um ambiente robusto de dados, com foco em construção e evolução de pipelines em larga escala, integração de múltiplas fontes e processamento distribuído em cloud.

O que você vai fazer:

Desenvolver e manter pipelines de dados com PySpark

Orquestrar workflows com Apache Airflow (DAGs em Python)

Trabalhar com processamento distribuído em ambiente AWS (EMR)

Integrar dados de diferentes fontes, incluindo APIs

Atuar na ingestão, transformação e disponibilização de dados

Garantir qualidade, performance e escalabilidade dos pipelines

O que buscamos:

Experiência com PySpark (Spark + Python)

Vivência com Airflow (criação/manutenção de DAGs)

Experiência com Scala

Experiência com APIs

Experiência com AWS (especialmente EMR, S3, Glue)

SQL sólido para manipulação de dados

Vivência com notebooks (Jupyter ou similares)

Diferenciais:

Experiência com arquitetura de dados (Data Lake / Lakehouse)

Vivência em ambientes de alto volume (Big Data)

Perfil comportamental:

Buscamos alguém com boa comunicação, autonomia e perfil consultivo, já que terá interação direta com o cliente.

Se candidatar

Criar um alerta

Salvar