Visão GeralCientista de Dados (Foco em Engenharia de Dados) – Embraer, São José dos Campos, SPJoin to apply for the Cientista de Dados (Foco em Engenharia de Dados) role at EmbraerResponsabilidades e atribuiçõesDesenvolver e manter pipelines de dados (ETL/ELT) escaláveis e resilientes;Implementar boas práticas de governança, versionamento e monitoramento de dados;Participar de discussões de arquitetura e propor soluções técnicas alinhadas às necessidades do negócio;Garantir a documentação adequada dos processos e pipelines desenvolvidos;Apoiar a evolução contínua do ambiente de dados, propondo automações e melhorias nos processos existentes.Como Será o Seu Dia a DiaVocê fará parte de uma equipe que atua na construção, manutenção e evolução de pipelines de dados que suportam decisões estratégicas e operacionais da empresa. O seu dia a dia envolve trabalhar próximo a analistas, cientistas de dados, desenvolvedores, arquitetos e stakeholders garantindo que os dados fluam com qualidade, segurança e eficiência entre sistemas.Principais DesafiosProjetar e implementar pipelines robustos para ingestão, processamento e disponibilização de dados em grande escala;Garantir a qualidade e a confiabilidade dos dados, lidando com dados faltantes, inconsistentes ou duplicados;Otimizar desempenho de processos ETL/ELT, identificando gargalos e propondo melhorias e/ou automatizações;Trabalhar com arquiteturas distribuídas e cloud (AWS, Azure ou GCP), aproveitando serviços gerenciados e boas práticas de segurança;Colaborar com outras áreas para entender requisitos de dados, modelar soluções adequadas e entregar valor de forma incremental.Informações de RequisitosSupervision completo;Inglês fluente/avançado/intermediário para leitura e escrita de documentação técnica e participação de eventos e reuniões;Experiência em linguagens de programação voltadas a dados (Python, SQL, JavaScript etc.);Experiência no design de pipelines robustos e escaláveis (ETL/ELT - dbt, Apache NiFi, Talend, Pentaho, Fivetran);Experiência em otimizar e automatizar queries, bancos e processos para alto desempenho;Experiência em implementação de pipelines e integração de APIs;Experiência com Hadoop, Spark, Parquet, Delta Lake;Conhecimento em modelagem de dados (OLTP, OLAP, data lakes, data warehouses);Conhecimento de ambientes Cloud (AWS, GCP e Azure);Conhecimento e prática de orquestração/automação (Airflow);Conhecimento de bancos de dados relacionais (PostgreSQL, MySQL, Oracle) e não-relacionais (MongoDB, Cassandra, Redis).DiferenciaisExperiência com streaming de dados (Kafka, Kinesis, Flink);Experiência com infraestrutura como código (IaC): Terraform, CloudFormation;Experiência com versionamento e CI/CD: Git, GitLab CI, Jenkins, AzureDevOps;Experiência com containers: Docker, Kubernetes;Conhecimento de data governance: catálogo de dados, linhagem, qualidade de dados;Noções de Machine Learning;Conhecimento em monitoramento.BenefíciosSeguro de VidaConvênio MédicoConvênio OdontológicoBenefício VacinaBenefício FarmáciaGympassCartão Multibenefícios (para modelo de trabalho Híbrido ou 100% remoto)Refeitório na empresaAuxílio Home Office (para modelo de trabalho Híbrido ou 100% remoto)PLR (Participação de Lucros e Resultados)Previdência PrivadaCooperativaEMpower (plataforma interna de treinamento e desenvolvimento)Observação: o modelo de trabalho pode ter alterações conforme definição estratégica da Embraer; consulte informações oficiais para o estado atual do modelo de trabalho.
#J-18808-Ljbffr