A Dadoteca é uma empresa inovadora no setor detecnologia, dedicada a fornecer soluções de alta qualidade paranossos clientes por meio de um ambiente de trabalho colaborativoque impulsiona o desenvolvimento profissional e a inovação.Atividades Projetar e implementar modelos de OCR utilizandoframeworks e bibliotecas avançadas para extração de dados dedocumentos estruturados e não estruturados. Analisar, preparar epré-processar grandes volumes de dados textuais, numéricos e,quando aplicável, espectrais, para uso em modelos de machinelearning e deep learning. Desenvolver pipelines completos deprocessamento de dados, incluindo extração, transformação,armazenamento e disponibilização dos resultados de OCR. Integrarsoluções de OCR com outras ferramentas e sistemas, automatizandofluxos de trabalho e processos de análise de dados. Realizartreinamentos, ajustes finos e manutenção de modelos de OCR paramelhorar a acurácia em diferentes idiomas, fontes, formatos eníveis de ruído. Explorar e aplicar técnicas de Processamento deLinguagem Natural (PNL) para enriquecer a análise, categorização eorganização dos textos extraídos. Aplicar técnicas de Quimiometriae análise multivariada (PCA, PLS, regressão multivariada e métodosde classificação) para modelagem, interpretação de dados complexose apoio à tomada de decisão. Desenvolver modelos preditivoscombinando dados textuais, numéricos e químicos/sensoriais, quandoaplicável. Atualizar modelos quimiométricos para previsão detargets químicos (ex.: Nicotina, Açúcar) e sensoriais (Impact,Amount, Ripeness, Quality, Irritation e taste wheel), incluindoaplicações em SWIR. Garantir a qualidade analítica dos resultadosgerados pelas plataformas analíticas por meio da gestão deindicadores, revisão de resultados e manutenção contínua dosmodelos. Verificar a acurácia dos resultados apresentados emdashboards e ferramentas digitais utilizadas pelas plataformasanalíticas. Apoiar o desenvolvimento de modelos de regressãoutilizando técnicas quimiométricas. Colaborar com equipesmultidisciplinares para garantir a integração das soluções de OCR eQuimiometria em projetos maiores de análise de dados. Monitorar emelhorar o desempenho dos modelos em produção, assegurandoescalabilidade, robustez, confiabilidade e aderência a padrões dequalidade e segurança. Pesquisar continuamente novas tecnologiasrelacionadas a OCR, Inteligência Artificial e Quimiometria,mantendo-se atualizada(o) com as tendências do setor. Orientartecnicamente colegas e apoiar equipes em projetos de altacomplexidade. Requisitos Formação superior em Ciência daComputação, Engenharia, Matemática, Estatística, Química,Engenharia Química ou áreas correlatas. Pós-graduação ouespecialização em Ciência de Dados, IA ou Quimiometria é desejável.Experiência consolidada em projetos de ciência de dados, com focoem OCR, processamento de imagens e/ou análise multivariada.Conhecimento prático em Quimiometria, incluindo PCA, PLS,regressão multivariada, métodos de classificação e validação demodelos. Conhecimento avançado em frameworks de deep learning(TensorFlow, PyTorch ou Keras). Experiência com bibliotecas de OCRcomo Tesseract, Google Vision, AWS Textract, ABBYY FineReader ousimilares. Habilidade com técnicas de pré-processamento de imagens(OpenCV ou PIL). Domínio de Python ou R para aplicações de ciênciade dados e modelagem estatística. Familiaridade com bancos de dadosrelacionais e não relacionais. Experiência com Git e práticas deMLOps. Inglês Fluente. Competências Capacidade de traduzirproblemas de negócio complexos em soluções analíticas eficientes.Liderança técnica e orientação de equipes em projetos de altacomplexidade. Compromisso com a entrega de soluções de altaqualidade e impacto mensurável. Comunicação clara de insightstécnicos para públicos técnicos e não técnicos. Proatividade parapropor soluções inovadoras e superar desafios técnicos.Diferenciais Experiência aplicada em Quimiometria com dados reais,incluindo interpretação de modelos e comunicação de resultados paraáreas de negócio. Familiaridade com Google Vision AI, AWS Textractou Azure Cognitive Services. Conhecimento avançado em PNL.Experiência com implantação de soluções de OCR e modelosquimiométricos em ambientes produtivos e escaláveis (Azure, AWS ouGoogle Cloud). Certificações como Microsoft Certified: Azure AIEngineer Associate ou Google Cloud Professional DataEngineer.