Local: Presencial | São Paulo - SP Descrição da vaga
Local
São Paulo - SP
Presencial com possibilidade de 2 dias home office
Responsabilidades
- Arquitetura, implantação e otimização de modelos de IA, com foco em Machine Learning (ML) e Large Language Models (LLMs);
- Desenvolvimento e ajuste fino (fine-tuning) de modelos de IA, utilizando técnicas avançadas de RAG (Retrieval-Augmented Generation), LoRA, quantização e distilação;
- Integração de modelos de IA em pipelines produtivos, garantindo escalabilidade, segurança e eficiência computacional;
- Monitoramento e manutenção de modelos em produção, aplicando MLOps para gestão do ciclo de vida dos modelos;
- Colaboração com equipes de desenvolvimento backend, garantindo interoperabilidade entre os modelos de IA e os sistemas baseados em Java e arquiteturas orientadas a serviços;
- Análise e engenharia de dados, garantindo a qualidade e a curadoria dos dados para o treinamento de modelos de IA.
Requisitos
- Mestrado concluído em Inteligência Artificial, Ciência da Computação, Engenharia de Dados ou áreas correlatas;
- Inglês avançado, com capacidade de comunicação técnica e escrita científica;
- Experiência (5+ anos) em Machine Learning e LLMs, incluindo arquitetura, tuning, implantação e otimização de modelos;
- Domínio de frameworks e bibliotecas de IA, como TensorFlow, PyTorch, Hugging Face Transformers e LangChain;
- Experiência com MLOps, utilizando Kubeflow, MLflow, Airflow ou Vertex AI para automação e monitoramento de modelos em produção;
- Pipeline de dados para IA, incluindo engenharia de features, data augmentation e tratamento de dados desbalanceados;
- Modelos generativos e NLP, com conhecimento aprofundado em Transformer-based architectures (GPT, BERT, T5, Llama, Mistral);
- Experiência com técnicas de otimização de modelos, incluindo quantização, sparsity, LoRA e fine-tuning supervisionado;
- Integração de modelos em APIs e serviços, utilizando FastAPI, Flask ou gRPC para servir modelos em produção;
- Experiência com arquiteturas escaláveis para inferência de IA, incluindo implementação de modelos em GPU, multi-node e edge computing;
- Versionamento e reprodutibilidade de experimentos, utilizando DVC, Weights & Biases ou MLflow;
- Experiência com bancos de dados vetoriais, como FAISS, Pinecone, Weaviate ou Milvus, para implementação de RAG (Retrieval-Augmented Generation);
- Domínio de infraestrutura de nuvem para IA, com e
Diferenciais
- Publicações científicas ou participação em projetos de pesquisa em IA/ML;
- Experiência com frameworks para redes neurais gráficas (GNNs);
- Conhecimento em segurança de modelos de IA, incluindo adversarial attacks e privacidade diferencial;
- Familiaridade com desenvolvimento de agentes autônomos baseados em LLMs (AutoGPT, BabyAGI, CrewAI);
- Experiência em integração de IA em sistemas críticos e ambientes restritos;
- Contribuições em projetos open-source na área de IA.
Benefícios
- Plano médico e odontológico Bradesco, extensivo a dependentes diretos
- Gympass (Wellhub) Programa de Saúde e Bem-estar: +Saúde Quick massage no escritório
- Seguro de vida
- Vale Refeição e Alimentação (cartão Swile)
- Vale Transporte
- PLR (Participação nos Lucros e Resultados)
- Previdência Privada
- Crédito Consignado
- Modelo de trabalho híbrido
- Horário flexível
- Vale-presente e day off no aniversário
- Auxílio creche para filhos até 71 meses
Processo seletivo
- Cadastro
- Avaliação de perfis
- Entrevista com RH
- Entrevista com Gestor(a)
- Contratação