Spassu Rio de Janeiro, Rio de Janeiro, BrazilSpassu Rio de Janeiro, Rio de Janeiro, BrazilCurte tecnologia, inovação e tem agilidade no DNA?Então talvez você tenha acabado de encontrar o seu próximo desafio!Na Spassu, estamos com um projeto incrível no ar — e ele está prontíssimo para receber profissionais com aquele algo a mais.Se você é CIENTISTA DE DADOS PL, tem perfil inquieto, gosta de aprender e quer crescer junto com uma empresa que valoriza ideias novas, vem com a gente!Aqui, você vai encontrar espaço para expandir seus conhecimentos, aplicar seu talento e fazer parte de algo realmente significativo.Inscreva-se e venha transformar com a Spassu!Os CV's permanecerão em poder da empresa enquanto perdurar o processo seletivo e pelo período adicional de 6 meses, para eventuais processos seletivos futuros, em atendimento a Lei Geral de Proteção de Dados.Curte tecnologia, inovação e tem agilidade no DNA?Então talvez você tenha acabado de encontrar o seu próximo desafio!Na Spassu, estamos com um projeto incrível no ar — e ele está prontíssimo para receber profissionais com aquele algo a mais.Se você é CIENTISTA DE DADOS PL, tem perfil inquieto, gosta de aprender e quer crescer junto com uma empresa que valoriza ideias novas, vem com a gente!Aqui, você vai encontrar espaço para expandir seus conhecimentos, aplicar seu talento e fazer parte de algo realmente significativo.Inscreva-se e venha transformar com a Spassu!Os CV's permanecerão em poder da empresa enquanto perdurar o processo seletivo e pelo período adicional de 6 meses, para eventuais processos seletivos futuros, em atendimento a Lei Geral de Proteção de Dados.PRINCIPAIS ATIVIDADES: Atuar nas atividades especializadas associadas ao processo Desenvolvimento e Sustentação designadas para sua equipe, de acordo com a sua disciplina/áreas de atuação e com os procedimentos, práticas e padrões técnicos definidos.Pré-processamento de bases textuais em algoritmos de processamento de linguagem natural, aplicação de métodos de pré-tratamento no pipeline de NLP para adequação de corpora textuais (tokenização, normalização de caracteres e valores numéricos, eliminação de ruídos e stopwords);Anotação individualizada de dados para utilização em treinamento de algoritmos de machine learning;Geração, refinamento (otimização de hiper parâmetros e decisões arquiteturais) e avaliação de modelos de dados (regressão, redes feed-forward, redes convolucionais, redes recorrentes, árvores de decisão, modelos ensemble, etc.);Avaliação das métricas de erro, performance e complexidade entre os modelos experimentados, para decisão do modelo final (considerando a possibilidade de modelos ensemble);Otimização de hiperparâmetros e refinamento de decisões arquiteturais dos modelos;Desenvolvimento de código para aplicar o modelo de aprendizado de máquina e registrar os resultados em bases de dados;Desenvolvimento ou atualização de código utilizando algoritmo Doc2Vec e as bibliotecas Gensim e Keras para realização de testes e avaliação de resultados de acordo com as métricas de acurácia, precisão, sensibilidade, F1 e AUV;Realização de testes com diferentes arquiteturas de rede neural, como camada oculta simples ou multicamadas, camada oculta grande, pequena, esparsa ou densa;Realização de testes com diferentes ajustes de parâmetros como Dropout, EarlyStop, algoritmos e validação;Desenvolvimento de código com teste automático dos diferentes parâmetros;Desenvolvimento do código de visualizações dos Datasets em bibliotecas em para implementação em painéis;Implementação de dashboards em ferramentas de visualização de dados;Avaliação de algoritmos e modelos para extração de atributos globais e locais para busca por conteúdo em imagens e vídeos, ordenação dos resultados, considerando tanto estado da arte (e.g. Google DELG, OpenAI Clip) quanto algoritmos clássicos (e.g. SIFT, SURF);Modelagem para extração de atributos globais para busca (high recall) por conteúdo em imagens e vídeos;Modelagem para extração de atributos locais para ordenação (high precision) de resultados em busca;Avaliação de bibliotecas de busca por similaridade vetorial para suportar busca por conteúdo em imagens e vídeos (e.g. Hnswlib, Google ScanNN, Facebook FAISS, Yahoo NGT);Desenvolvimento de protótipo de pipeline para extração e indexação de atributos locais e globais para vídeos (novos uploads, primeiro processamento da base existente, reprocessamento da base existente) a ser integrado na aplicação e base de dados; visualização de resultados de busca por conteúdo na base, agregado a nível de operação, com métricas, gráficos e preview de imagens (estáticos e animados); extração e indexação de etiquetas (classificação), caixas (detecção), regiões (segmentação), textos (OCR) para vídeos (novos uploads, primeiro processamento da base existente, reprocessamento da base existentes) a ser integrado na aplicação e base de dados.Realizar atividades correlatas, de acordo com orientação do gestor.RequisitosGraduação completa na área de conhecimento de Ciência de Dados, Tecnologia da Informação, Engenharia, Matemática, Estatística, Física ou Química; ou graduação em nível superior em qualquer área de conhecimento acrescida de curso de pós-graduação (especialização, mestrado ou doutorado) com duração mínima de 360 horas na área de conhecimento de Ciência de Dados, Tecnologia da Informação, Engenharia, Matemática, Estatística, Física ou Química.0 5 (cinco) anos como Cientista de Dados, Analista de Sistemas ou cargo correlato atuando no desenvolvimento de soluções de software na área de Ciência de Dados. Experiência no desenvolvimento de projetos com aplicação de IA (Machine Learning, Deep Learning e/ou IA Generativa).Conhecimentos em extração de dados por algoritmo automatizado; Conversão dos dados para formatos adequados; Normalização de valores numéricos, tratamento de dados ausentes e valores categóricos; Pré-processamento de dados não estruturados; Aplicação de métodos estatísticos para identificar possíveis correlações entre variáveis e identificar variáveis mais significativas; Visualizações gráficas exploratórias, realização de análises exploratórias nos dados a partir de diferentes visualizações gráficas (histogramas, scatterplots, heatmaps, matrizes de correlação, etc.); Aplicação de técnicas de engenharia de features, redução de dimensionalidade (PCA, tSNE, SVD) e métodos estatísticos para identificação de features latentes e criação de variáveis derivadas; Aplicação de métodos de pré-tratamento para adequação de dados não-estruturados (imagens, dados de sensores, sísmica, áudio, etc.).Local de Trabalho: RIO DE JANEIRO (Centro)Atuação no modelo HÍBRIDOBenefíciosPlano de SaúdePlano OdontológicoSeguro de VidaVale Alimentação ou RefeiçãoVale TransporteWellHub - GympassRio de Janeiro, Rio de Janeiro, Brazil 19 hours agoRio de Janeiro, Rio de Janeiro, Brazil 2 weeks agoRio de Janeiro, Rio de Janeiro, Brazil 1 week agoCIENTISTA DE DADOS SENIOR (ANALISTA TECNOLOGIA INFORMAÇÂO 2 SENIOR) – GERÊNCIA DE INTELIGENCIA DE DADOS AUDITORIA & CONFORMIDADE – CORPORATIVORio de Janeiro, Rio de Janeiro, Brazil 1 month agoRio de Janeiro, Rio de Janeiro, Brazil 1 day agoRio de Janeiro, Rio de Janeiro, Brazil 23 hours agoVisagio Talentos - Estágio: Data Science e IA Generativa RJRio de Janeiro, Rio de Janeiro, Brazil 4 days agoVisagio Talentos - Formados: Data Science e IA Generativa RJRio de Janeiro, Rio de Janeiro, Brazil 2 days agoCientista de Dados Sênior / Híbrido - São PauloCientista de Dados Sênior / Híbrido - Rio de JaneiroGreater Rio de Janeiro R$7,000.00-R$7,000.00 1 day agoRio de Janeiro, Rio de Janeiro, Brazil 1 week agoGreater Rio de Janeiro R$5,001.00-R$6,000.00 2 months agoRio de Janeiro, Rio de Janeiro, Brazil 2 weeks agoRio de Janeiro, Rio de Janeiro, Brazil 1 month agoRio de Janeiro, Rio de Janeiro, Brazil 1 week agoNiterói, Rio de Janeiro, Brazil 4 days agoONS | Ciência de Dados, Eng. de Produção, SI | EstágioRio de Janeiro, Rio de Janeiro, Brazil R$1,737.00-R$1,737.00 5 days agoNova Iguaçu, Rio de Janeiro, Brazil 3 months ago
#J-18808-Ljbffr