Você é um(a) bioinformata em início de carreira, com vontade de aprender, crescer profissionalmente e atuar em um ambiente de alta complexidade técnica? Gosta de trabalhar com dados genômicos, aprender novas ferramentas e contribuir para a construção de soluções que farão parte de um projeto nacional estratégico? Então esta vaga pode ser para você. O Centro de Integração de Dados e Conhecimentos para Saúde (Cidacs/Fiocruz Bahia) está recrutando um(a) Bioinformata Júnior para atuar no Piloto do Repositório Nacional de Dados Genômicos do Programa Genomas Brasil, projeto prioritário do Ministério da Saúde/DECIT. Você fará parte de uma equipe multidisciplinar responsável pela criação da base técnica, metodológica e arquitetural que dará origem ao repositório nacional que integrará dados genômicos, fenotípicos e clínicos de projetos financiados pelo DECIT. Sua atuação será estratégica: você definirá arquiteturas, implementará e validará pipelines modernos em HPC, estabelecerá padrões de qualidade para sequências e metadados, e liderará a publicação de catálogos, ontologias e esquemas de versionamento e reprodutibilidade — seguindo padrões GA4GH e melhores práticas globais. A vaga poderá ser REMOTA ou presencial, na sede do CIDACS localizada no Parque Tecnológico da Bahia - Edifício Tecnocentro, Rua Mundo 121, Trobogy. Responsabilidades e atribuições - Apoio no desenho e implementação de pipelines de bioinformática: Colaborar no desenvolvimento e na execução de pipelines reprodutíveis (pré-processamento, alinhamento, chamadas de variantes), utilizando containers e aprendendo melhores práticas internacionais (GATK Best Practices, nf-core), sempre com supervisão da equipe mais experiente. - Suporte na definição de métricas e painéis de QC: Apoiar a equipe na verificação da qualidade de sequências (FASTQ/BAM/VCF) e metadados clínico-fenotípicos, auxiliando no cálculo de métricas, organização de relatórios e identificação inicial de possíveis inconsistências. - Auxílio em rotinas de automação: Contribuir para a criação e manutenção de rotinas automatizadas para ingestão e validação de dados, seguindo modelos, scripts e frameworks já utilizados pela equipe, com foco em padronização e eficiência. - Apoio à consolidação de catálogos e metadados: Participar da organização e atualização de catálogos de variantes e metadados, ajudando em tarefas de indexação, versionamento e harmonização de informações conforme ontologias e padrões reconhecidos. - Colaboração na elaboração de Procedimentos Operacionais Padrão (SOPs): Ajudar na preparação de documentos técnicos, guias e templates, contribuindo para a padronização e reprodutibilidade dos processos, com orientação da equipe técnica. - Participação na documentação dos processos e pipelines: Auxiliar na criação e manutenção da documentação das soluções implementadas, garantindo clareza, organização e apoio ao trabalho da equipe, contribuindo para a rastreabilidade e evolução futura dos processos. Requisitos e qualificações - QUALIFICAÇÕES E REQUISITOS OBRIGATÓRIOS: _FORMAÇÃO:_ - Graduação completa em Bioinformática, Biologia, Biotecnologia, Computação, Engenharia Biomédica ou áreas correlatas OU especialização/mestrado em áreas relacionadas à genômica, biologia computacional ou análise de dados biomédicos. _ EXPERIÊNCIA:_ - Experiência prévia de pelo menos 1 ano em bioinformática (projetos acadêmicos, iniciação científica, estágios, ICs, TCCs, participações em laboratórios ou grupos de pesquisa). - Experiência básica com pipelines ou etapas bioinformáticas (pré-processamento, alinhamento, chamadas de variantes). - Participação em projetos ou atividades envolvendo dados genômicos, exoma ou painéis — acadêmicos ou profissionais. _ HABILIDADE TÉCNICAS:_ - Conhecimento inicial de Nextflow e/ou WDL/Cromwell, com disposição para aprofundamento e aprendizado prático. - Familiaridade com ferramentas essenciais: BWA, samtools/bcftools, Picard, FastQC, mesmo que aplicada em contextos acadêmicos. - Interesse e noções básicas sobre ontologias biomédicas (HPO, SNOMED, OMOP) ou metadados clínicos. - Experiência inicial com containers (Docker ou Singularity/Apptainer). - Noções de QC e curadoria de dados genômicos (ex.: uso de FastQC, MultiQC). - Conhecimento básico de ambientes Linux e Shell Script. - Familiaridade com Git e versionamento de código. - Interesse em aprender sobre execução em HPC (SLURM, filas, quotas). _ HABILIDADE INTERPESSOAIS:_ - Boa capacidade de organização e aprendizado contínuo. - Abordagem analítica e curiosidade científica. - Facilidade para trabalhar em equipe multidisciplinar. - Comunicação clara e abertura para receber orientação técnica. - DESEJÁVEIS, MAS NÃO OBRIGATÓRIOS: _ OUTRAS QUALIFICAÇÕES:_ - Conhecimento introdutório sobre padrões GA4GH (ex.: já ter lido ou utilizado Phenopackets, DUO, htsget). - Experiência prévia com ferramentas de coleta e organização de dados clí