Formação e experiência
* Graduação em Ciência da Computação, Engenharia, Matemática, Estatística ou áreas similares.
Requisitos obrigatórios
* Conhecimento em Python (pandas, numpy, scikit-learn ou similares)
* Noções de estatística e probabilidade
* Conhecimento básico de SQL
* Interesse em machine learning e análise de dados
* Conhecimento com ferramentas de visualização (Power BI, Looker, Tableau).
Requisitos desejáveis
1. Conhecimento em bibliotecas de visualização (matplotlib, seaborn, etc.)
2. Noções de versionamento de código (Git) e de dados (Delta ou Iceberg)
3. Familiaridade com notebooks (Jupyter, Colab)
4. Conhecimento básico em cloud ou big data
5. Participação em competições, cursos ou bootcamps de dados
6. Familiaridade com padrões de dados em saúde (openEHR, HL7, FHIR).
* Apoiar na análise exploratória de dados (EDA) e modelagem analítica nas camadas do data lake utilizando ferramentas como DBT e AirFlow.
* Realizar limpeza, tratamento e preparação de dados
* Auxiliar no desenvolvimento e avaliação de modelos estatísticos e de machine learning
* Criar consultas em SQL para extração e análise de dados
* Apoiar a definição e acompanhamento de métricas
* Desenvolver análises e relatórios com supervisão do time
* Documentar análises, códigos e aprendizados
* Trabalhar em parceria com cientistas, engenheiros de dados e áreas de negócio