Descrição da vagaResponsabilidades e atribuições
Atividades:
* Arquitetura, implantação e otimização de modelos de IA, com foco em Machine Learning (ML) e Large Language Models (LLMs);
* Desenvolvimentoe ajuste fino (fine-tuning) de modelos de IA, utilizando técnicas avançadas de RAG (Retrieval-Augmented Generation), LoRA, quantização e distilação;
* Integração de modelos de IA em pipelines produtivos, garantindo escalabilidade, segurança e eficiência computacional;
* Monitoramento emanutenção de modelos em produção, aplicando MLOps para gestão do ciclo de vida dos modelos;
* Colaboração comequipes de desenvolvimento backend, garantindo interoperabilidade entre os modelos de IA e os sistemas baseados em Java e arquiteturas orientadas a serviços;
* Análise e engenharia de dados, garantindo a qualidade e a curadoria dos dados para o treinamento de modelos de IA.
Requisitos e qualificações
Requisitos:
* Mestrado concluído em Inteligência Artificial, Ciência da Computação, Engenharia de Dados ou áreas correlatas;
* Inglês avançado, com capacidade de comunicação técnica e escrita científica;
* Experiência (5+anos) em Machine Learning e LLMs, incluindo arquitetura, tuning, implantação e otimização de modelos;
* Domínio de frameworks e bibliotecas de IA, como TensorFlow, PyTorch, Hugging Face Transformers e LangChain;
* Experiência comMLOps, utilizando Kubeflow, MLflow, Airflow ou Vertex AI para automação e monitoramento de modelos em produção;
* Pipeline de dados para IA, incluindo engenharia de features, data augmentation e tratamento de dados desbalanceados;
* Modelos generativos e NLP, com conhecimento aprofundado em Transformer-based architectures (GPT, BERT, T5, Llama, Mistral);
* Experiência comtécnicas de otimização de modelos, incluindo quantização, sparsity, LoRA e fine-tuning supervisionado;
* Integração de modelos em APIs e serviços, utilizando FastAPI, Flask ou gRPC para servir modelos em produção;
* Experiência comarquiteturas escaláveis para inferência de IA, incluindo implementação de modelos em GPU, multi-node e edge computing;
* Versionamento ereprodutibilidade de experimentos, utilizando DVC, Weights & Biases ou MLflow;
* Experiência combancos de dados vetoriais, como FAISS, Pinecone, Weaviate ou Milvus, para implementação de RAG (Retrieval-Augmented Generation);
* Domínio de infraestrutura de nuvem para IA, com experiência prática em AWS (SageMaker, Bedrock), GCP (Vertex AI) ou Azure ML;
* Inglês intermediário/avançado.
Diferenciais:
* Publicações científicas ou participação em projetos de pesquisa em IA/ML;
* Experiência comframeworks para redes neurais gráficas (GNNs);
* Conhecimento emsegurança de modelos de IA, incluindo adversarial attacks e privacidade diferencial;
* Familiaridade com desenvolvimento de agentes autônomos baseados em LLMs (AutoGPT, BabyAGI, CrewAI);
* Experiência em integração de IA em sistemas críticos e ambientes restritos;
* Contribuições em projetos open-source na área de IA.
Informações adicionais
Local de Trabalho:
Vila Olimpia - São Paulo-SP
Presencial com possibilidade de 2 dias home office
O que oferecemos:
* Plano médico e odontológico Bradesco, extensivo a dependentes diretos
* Gympass (Wellhub)
* Programa de Saúde e Bem-estar: +Saúde
* Quick massage no escritório
* Seguro de vida
* Vale Refeição e Alimentação (cartão Swile)
* Vale Transporte
* PLR (Participação nos Lucros e Resultados)
* Previdência Privada
* Crédito Consignado
* Modelo de trabalho híbrido
* Horário flexível
* Vale-presente e day off no aniversário
* Auxílio creche para filhos até 71 meses
#J-18808-Ljbffr