Visão Geral
Cientista de Dados (Foco em Engenharia de Dados) – Embraer, São José dos Campos, SP
Join to apply for the Cientista de Dados (Foco em Engenharia de Dados) role at Embraer
Responsabilidades e atribuições
* Desenvolver e manter pipelines de dados (ETL/ELT) escaláveis e resilientes;
* Implementar boas práticas de governança, versionamento e monitoramento de dados;
* Participar de discussões de arquitetura e propor soluções técnicas alinhadas às necessidades do negócio;
* Garantir a documentação adequada dos processos e pipelines desenvolvidos;
* Apoiar a evolução contínua do ambiente de dados, propondo automações e melhorias nos processos existentes.
Como Será o Seu Dia a Dia
Você fará parte de uma equipe que atua na construção, manutenção e evolução de pipelines de dados que suportam decisões estratégicas e operacionais da empresa. O seu dia a dia envolve trabalhar próximo a analistas, cientistas de dados, desenvolvedores, arquitetos e stakeholders garantindo que os dados fluam com qualidade, segurança e eficiência entre sistemas.
Principais Desafios
* Projetar e implementar pipelines robustos para ingestão, processamento e disponibilização de dados em grande escala;
* Garantir a qualidade e a confiabilidade dos dados, lidando com dados faltantes, inconsistentes ou duplicados;
* Otimizar desempenho de processos ETL/ELT, identificando gargalos e propondo melhorias e/ou automatizações;
* Trabalhar com arquiteturas distribuídas e cloud (AWS, Azure ou GCP), aproveitando serviços gerenciados e boas práticas de segurança;
* Colaborar com outras áreas para entender requisitos de dados, modelar soluções adequadas e entregar valor de forma incremental.
Informações de Requisitos
* Supervision completo;
* Inglês fluente/avançado/intermediário para leitura e escrita de documentação técnica e participação de eventos e reuniões;
* Experiência em linguagens de programação voltadas a dados (Python, SQL, JavaScript etc.);
* Experiência no design de pipelines robustos e escaláveis (ETL/ELT - dbt, Apache NiFi, Talend, Pentaho, Fivetran);
* Experiência em otimizar e automatizar queries, bancos e processos para alto desempenho;
* Experiência em implementação de pipelines e integração de APIs;
* Experiência com Hadoop, Spark, Parquet, Delta Lake;
* Conhecimento em modelagem de dados (OLTP, OLAP, data lakes, data warehouses);
* Conhecimento de ambientes Cloud (AWS, GCP e Azure);
* Conhecimento e prática de orquestração/automação (Airflow);
* Conhecimento de bancos de dados relacionais (PostgreSQL, MySQL, Oracle) e não-relacionais (MongoDB, Cassandra, Redis).
Diferenciais
* Experiência com streaming de dados (Kafka, Kinesis, Flink);
* Experiência com infraestrutura como código (IaC): Terraform, CloudFormation;
* Experiência com versionamento e CI/CD: Git, GitLab CI, Jenkins, AzureDevOps;
* Experiência com containers: Docker, Kubernetes;
* Conhecimento de data governance: catálogo de dados, linhagem, qualidade de dados;
* Noções de Machine Learning;
* Conhecimento em monitoramento.
Benefícios
* Seguro de Vida
* Convênio Médico
* Convênio Odontológico
* Benefício Vacina
* Benefício Farmácia
* Gympass
* Cartão Multibenefícios (para modelo de trabalho Híbrido ou 100% remoto)
* Refeitório na empresa
* Auxílio Home Office (para modelo de trabalho Híbrido ou 100% remoto)
* PLR (Participação de Lucros e Resultados)
* Previdência Privada
* Cooperativa
* EMpower (plataforma interna de treinamento e desenvolvimento)
Observação: o modelo de trabalho pode ter alterações conforme definição estratégica da Embraer; consulte informações oficiais para o estado atual do modelo de trabalho.
#J-18808-Ljbffr