Você acredita que o futuro pode ser melhorado através da saúde? Gosta de tecnologia e inovação? Entende que a saúde não pode esperar — por isso, precisamos ter pressa nas nossas entregas para salvar o maior número de pacientes possível?
Então, talvez você goste do que vai encontrar aqui na Level!
Precisamos de um Cientista de Dados para somar ao nosso time.
O que esperamos do seu perfil
Comunicação Assertiva
Para nós, é a base. Esperamos que você seja uma pessoa comunicativa, com clareza tanto verbal quanto escrita. Saber dialogar com diferentes perfis — devs, produto, negócio — é essencial no nosso universo.
Mentalidade Estratégica
Ser proativo e resolutivo nas situações do dia a dia, ter visão sistêmica e capacidade analítica para enxergar além do problema imediato — antecipando gargalos antes que eles virem incidente.
Foco na Solução
"Esse problema não é meu" não faz parte do nosso vocabulário. Responsabilidade e proatividade para garantir a confiabilidade de cada serviço são papel de todo mundo aqui. Melhor o básico bem feito do que nada feito.
Curiosidade e Inovação
Acreditamos que conhecimento é a base. Ser curioso, ter paixão por aprender e acompanhar as tendências em infraestrutura, automação e observabilidade é o que esperamos de você.
Hard Skills
Python para ciência de dados: manipulação de dados, modelagem e construção de pipelines reprodutíveis;
SQL e preparação de dados: consulta, limpeza, transformação e estruturação de bases para análise e modelagem;
Machine Learning supervisionado: treino, validação, escolha de métricas, controle de overfitting e análise de erro;
NLP aplicado: Hugging Face, classificação de textos, extração de informação (NER), embeddings, similaridade semântica e sumarização;
Aplicação de GenAI: prompt engineering, uso de APIs ou modelos open source, avaliação de respostas e geração de saídas estruturadas;
Experimentação e avaliação de modelos: fundamentos em metodologia científica, desenho de experimentos, comparação de abordagens, documentação de resultados e tomada de decisão baseada em métricas;
Git/GitHub: versionamento de código e colaboração em projetos;
Noções de MLOps: integração com produto, APIs, Docker, versionamento ou monitoramento de modelos;
Tracking de experimentos: familiaridade com MLflow, Weights & Biases ou ferramentas similares.
Diferenciais:
Frameworks e Arquiteturas de GenAI: Experiência prática com arquiteturas RAG, embeddings, busca vetorial e ferramentas como LangChain, LlamaIndex ou similares;
Otimização e Adaptação de Modelos: fine-tuning de modelos pré-treinados e técnicas de eficiência/compressão (como LoRA, quantização ou destilação de modelos);
Experiência prática em dados de saúde: processamento de textos médicos em português e conhecimento em padrões ou terminologias de saúde (como CID-10, SNOMED CT ou padrões de interoperabilidade como HL7/FHIR);
Governança e Segurança: Conhecimento em práticas de privacidade, anonimização e governança de dados sensíveis no setor de saúde.
Seus desafios:
Criação de Modelos de processamento de linguagem natural
Desenvolvimento de algoritmos aplicando LLM
Análise de Dados e geração de insights
Organização de experimentos, validação e teste de modelos
Deploy dos modelos junto a equipe de produto permitindo a comunicação com outros serviços
Otimização e melhoria contínua dos processos de ciência de dados
Propor e implementar soluções inovadoras, alinhadas à novas tecnologias e melhores práticas do mercado.
Pacote de benefícios e remuneração
Modelo de contratação PJ
VR/VA: aproximadamente R$ 1.230,00/mês
Plano de Saúde: Amil (há uma categoria 100% subsidiada pela empresa e uma com desconto em NF, a escolher na admissão)
Seguro de Vida em Grupo: Porto Seguro (cobertura de 6 salários)
Auxílio Home Office: R$ 100,00/mês
Auxílio Flexível: R$ 100,00/mês
Clude Saúde
Total Pass
Salário: R$ 10k a R$ 12k, avaliado pelo seu nível de conhecimento e experiência.