Estamos em busca de um(a) Cientista de Dados para atuar em nossa health tech.
A pessoa terá autonomia para explorar nosso Data Lake e desenvolver novas funcionalidades baseadas em ciência de dados e inteligência artificial, voltadas para apoiar clientes do setor de saúde.
O foco é transformar grandes volumes de dados em modelos, produtos e ferramentas que tragam valor prático, ampliando a eficiência e a qualidade das entregas.
Responsabilidades e Atribuições
Explorar e manipular grandes volumes de dados no Data Lake da empresa.
Desenvolver novas funcionalidades baseadas em ciência de dados e inteligência artificial.
Construir, treinar e validar modelos estatísticos e de machine learning aplicados ao setor de saúde.
Estruturar pipelines e processos de análise em Python.
Produzir análises avançadas relacionadas a custos, utilização e sinistralidade.
Transformar dados complexos em informações aplicáveis para diferentes perfis de clientes.
Atuar com o CTO propondo abordagens inovadoras e eficientes.
Experiências Desejadas
Experiência sólida com Python e bibliotecas de análise de dados.
Conhecimento em estatística aplicada e machine learning (incluindo métodos clássicos como árvores de decisão, regressões e classificadores).
Vivência prática em ciência de dados aplicada à saúde (custos, utilização, sinistralidade).
Experiência com bancos de dados SQL (preferencialmente compatíveis com MariaDB).
Formação
Graduação completa ou em andamento em Computação, Estatística ou Saúde.
Cursos complementares em ciência de dados, inteligência artificial ou análise de dados são diferenciais.
Conhecimentos Técnicos
Python (manipulação de dados, estatística, machine learning).
SQL (preferencialmente bancos compatíveis com MariaDB).
Estatística aplicada e técnicas de machine learning (ex.: árvores de decisão, regressões, classificadores).
Bibliotecas de análise e visualização: Pandas, Matplotlib, Seaborn, Plotly.
Ferramentas de Business Intelligence: Power BI, Tableau ou Looker Studio (diferencial).
Conhecimento em Jupyter Notebooks (diferencial).
Noções de Data Lake e manipulação de grandes volumes de dados (diferencial).
Certificações Desejáveis
Certificações em Python para análise de dados.
Certificação em SQL ou bancos de dados relacionais.
Cursos ou certificações em ciência de dados aplicada à saúde.