Descrição da vaga
Responsabilidades e atribuições
Atividades:
Arquitetura, implantação e otimização de modelos de IA, com foco em Machine Learning (ML) e Large Language Models (LLMs);
Desenvolvimento e ajuste fino (fine-tuning) de modelos de IA, utilizando técnicas avançadas de RAG (Retrieval-Augmented Generation), LoRA, quantização e distilação;
Integração de modelos de IA em pipelines produtivos, garantindo escalabilidade, segurança e eficiência computacional;
Monitoramento e manutenção de modelos em produção, aplicando MLOps para gestão do ciclo de vida dos modelos;
Colaboração com equipes de desenvolvimento backend, garantindo interoperabilidade entre os modelos de IA e os sistemas baseados em Java e arquiteturas orientadas a serviços;
Análise e engenharia de dados, garantindo a qualidade e a curadoria dos dados para o treinamento de modelos de IA.
Requisitos e qualificações
Requisitos:
Mestrado concluído em Inteligência Artificial, Ciência da Computação, Engenharia de Dados ou áreas correlatas;
Inglês avançado, com capacidade de comunicação técnica e escrita científica;
Experiência (5+ anos) em Machine Learning e LLMs, incluindo arquitetura, tuning, implantação e otimização de modelos;
Domínio de frameworks e bibliotecas de IA, como TensorFlow, PyTorch, Hugging Face Transformers e LangChain;
Experiência com MLOps, utilizando Kubeflow, MLflow, Airflow ou Vertex AI para automação e monitoramento de modelos em produção;
Pipeline de dados para IA, incluindo engenharia de features, data augmentation e tratamento de dados desbalanceados;
Modelos generativos e NLP, com conhecimento aprofundado em Transformer-based architectures (GPT, BERT, T5, Llama, Mistral);
Experiência com técnicas de otimização de modelos, incluindo quantização, sparsity, LoRA e fine-tuning supervisionado;
Integração de modelos em APIs e serviços, utilizando FastAPI, Flask ou gRPC para servir modelos em produção;
Experiência com arquiteturas escaláveis para inferência de IA, incluindo implementação de modelos em GPU, multi-node e edge computing;
Versionamento e reprodutibilidade de experimentos, utilizando DVC, Weights & Biases ou MLflow;
Experiência com bancos de dados vetoriais, como FAISS, Pinecone, Weaviate ou Milvus, para implementação de RAG (Retrieval-Augmented Generation);
Domínio de infraestrutura de nuvem para IA, com experiência prática em AWS (SageMaker, Bedrock), GCP (Vertex AI) ou Azure ML;
Inglês intermediário/avançado.
Diferenciais:
Publicações científicas ou participação em projetos de pesquisa em IA/ML;
Experiência com frameworks para redes neurais gráficas (GNNs);
Conhecimento em segurança de modelos de IA, incluindo adversarial attacks e privacidade diferencial;
Familiaridade com desenvolvimento de agentes autônomos baseados em LLMs (AutoGPT, BabyAGI, CrewAI);
Experiência em integração de IA em sistemas críticos e ambientes restritos;
Contribuições em projetos open-source na área de IA.
Informações adicionais
Local de Trabalho:
Vila Olimpia - São Paulo-SP
Presencial com possibilidade de 2 dias home office
O que oferecemos:
Plano médico e odontológico Bradesco, extensivo a dependentes diretos
Gympass (Wellhub)
Programa de Saúde e Bem-estar: +Saúde
Quick massage no escritório
Seguro de vida
Vale Refeição e Alimentação (cartão Swile)
Vale Transporte
PLR (Participação nos Lucros e Resultados)
Previdência Privada
Crédito Consignado
Modelo de trabalho híbrido
Horário flexível
Vale-presente e day off no aniversário
Auxílio creche para filhos até 71 meses
#J-18808-Ljbffr