Nossa missão é transformar dados em insights acionáveis. Como Cientista de Dados, você será responsável por coletar e analisar grandes conjuntos de dados para identificar padrões e tendências que possam ajudar a tomar decisões informadas.
Descrição do cargo
O nosso cientista de dados trabalhará em projetos de análise de dados massivos (big data) e aplicação de modelos de machine learning. Além disso, você também terá a oportunidade de contribuir para o desenvolvimento de soluções inovadoras em parceria com nossos clientes.
Requisitos e habilidades
* Ensino superior completo em Tecnologia da Informação ou áreas correlatas;
* Experiência anterior na função de Cientista de Dados;
* Domínio de SQL para manipulação de grandes volumes de dados;
* Conhecimentos sólidos em Python e/ou PySpark, com foco em análise e modelagem de dados;
* Experiência com processos de extração, transformação e carga de dados (ETL), incluindo tratamento e limpeza;
* Conhecimento em estatística aplicada e interpretação de métricas e testes estatísticos;
* Vivência em projetos de análise de dados massivos (big data);
* Experiência prática com técnicas de data mining e aplicação de modelos de machine learning (classificação, regressão, clustering, etc.);
* Conhecimento em ferramentas de visualização de dados, com destaque para Microsoft Power BI;
* Boa comunicação interpessoal e capacidade de traduzir dados em insights acionáveis;
* Foco em solução de problemas e tomada de decisão orientada por dados;
* Conhecimento em ecossistemas de Big Data, como Apache Hive, Hadoop, MapReduce e Apache Spark;
* Experiência com plataforma Databricks para desenvolvimento e execução de pipelines de dados;
Benefícios
* Vale alimentação ou vale refeição;
* Desconto em cursos, universidades e instituições de idiomas;
* Academia Stefanini - plataforma com cursos online, gratuitos, atualizados e com certificado;
* Mentoring;
* Clube de vantagens para consultas e exames;
* Assistência médica;
* Assistência odontológica;
* Clube de viagens;
* Convênio para pet;
Tecnologias usadas
A tecnologia usada inclui:
* Python;
* PySpark;
* SQL;
* Microsoft Power BI;
* Databricks;
* Hadoop;
* Apache Spark;