Pesquisador em Arquitetura de Dados e Engenharia de Big Data para Saúde
Join to apply for the Pesquisador em Arquitetura de Dados e Engenharia de Big Data para Saúde role at Cidacs / Fiocruz Bahia.
O Centro de Integração de Dados e Conhecimentos para Saúde (Cidacs/Fiocruz Bahia) busca um Pesquisador em Arquitetura de Dados e Engenharia de Big Data para integrar a equipe da Plataforma de Dados. Esta posição é fundamental para o desenvolvimento e aprimoramento das infraestruturas de dados utilizadas para pesquisas em saúde.
O pesquisador será responsável por projetar, otimizar e manter arquiteturas escaláveis para processamento e integração de grandes volumes de dados, incluindo construção de datalakes, data lakehouses e pipelines de dados, garantindo eficiência, segurança e governança em ambientes distribuídos de Big Data. Trabalhará em colaboração com engenheiros, cientistas de dados e especialistas em saúde para desenvolver soluções inovadoras e avançar a ciência de dados aplicada à saúde.
Principais desafios incluem aprimorar estruturas longitudinais da Coortes do Cidacs, desenvolvendo metodologias em arquitetura de dados e ambientes computacionais seguros e eficientes, além de desenvolver pesquisas e produção científica na área de Ciência de Dados Populacional.
Este é um cargo de pesquisa com duração inicial de 2 anos, renovável conforme desempenho e necessidades do projeto.
Nossa cultura valoriza a colaboração interdisciplinar, uso de tecnologias de ponta e ética na gestão de dados. Buscamos profissionais motivados por desafios, inovação e impacto social. Se deseja aplicar sua experiência em arquitetura de dados e Big Data para transformar a pesquisa em saúde no Brasil, essa vaga é para você!
Responsabilidades e atribuições
* Colaborar com equipes multidisciplinares, incluindo cientistas de dados, epidemiologistas e analistas, traduzindo desafios científicos em soluções tecnológicas inovadoras.
* Desenvolver pesquisas em Ciência de Dados Populacional alinhadas às prioridades do Cidacs.
* Participar de reuniões técnicas para disseminar conhecimento e otimizar operações de dados.
* Apoiar iniciativas de modernização de arquitetura de dados, incorporando novas tecnologias e boas práticas.
* Projetar e otimizar bancos de dados SQL e NoSQL para as pesquisas do Cidacs.
* Documentar arquiteturas, fluxos e estratégias de dados para facilitar manutenção e escalabilidade.
* Auxiliar na avaliação e implementação de data lakes e data lakehouses.
* Gerenciar pipelines de dados usando ferramentas de processamento distribuído.
* Monitorar desempenho e escalabilidade da arquitetura de dados, solucionando gargalos.
* Implementar governança e segurança de dados, garantindo conformidade regulatória.
* Apoiar atividades de pré-processamento, vinculação de dados e construção de datasets para estudos epidemiológicos.
* Elaborar relatórios técnicos periódicos sobre infraestrutura de dados.
Requisitos e qualificações
* Graduação em Ciência da Computação, Engenharia de Computação, Sistemas de Informação ou áreas correlatas.
* Graduação avançada (mestrado/doutorado) nas áreas indicadas.
* Experiência mínima de 2 anos em arquitetura de dados e gestão de bancos de dados em grande escala.
* Conhecimento avançado em modelagem de dados, bancos SQL e NoSQL.
* Experiência com arquiteturas de Big Data (ex.: Spark, ElasticSearch).
* Experiência em data lakes e lakehouses (ex.: Delta Lake).
* Conhecimento em otimização de grandes volumes de dados e motores de consulta (ex.: Trino, Presto).
* Experiência em processos ETL/ELT e automação de pipelines com Apache Airflow.
* Controle de versão (Git) e práticas de CI/CD.
* Ambiente Linux e scripting (ex.: Bash, Python).
* Capacidade de trabalho em equipes multidisciplinares e inglês técnico.
Requisitos diferenciais
* Experiência com dados de saúde pública e estudos de coortes.
* Publicações na área de computação aplicada à saúde.
* Design de esquemas para alta performance, bancos orientados a colunas.
* Experiência com governança de dados e frameworks de boas práticas.
* Conhecimento em containers (Docker, Kubernetes).
* Certificações em Big Data e arquitetura de dados.
* Inglês avançado para comunicação com grupos internacionais.
Informações adicionais
O Cidacs/Fiocruz Bahia oferece ambiente dinâmico, infraestrutura avançada, oportunidades de colaboração nacional e internacional, e valorização da inovação e desenvolvimento contínuo.
Período inicial de 12 meses, renovável. Benefícios incluem suporte para doutorado/pós-doutorado, infraestrutura de processamento, oportunidades de networking, capacitação, regime híbrido, incentivo à publicação e participação em redes de pesquisa.
Áreas prioritárias para pesquisa
* Arquitetura e Engenharia de Dados para Saúde
* Ciência de Dados Populacional e Saúde Pública
* Privacidade, Segurança e Governança de Dados
* Inteligência Artificial e Machine Learning em Saúde
* Infraestrutura Computacional para Pesquisa em Saúde
Se deseja aplicar seu conhecimento para desafios reais de Big Data e ciência de dados populacional, contribuindo para a saúde no Brasil e no mundo, venha fazer parte do Cidacs/Fiocruz Bahia! #J-18808-Ljbffr