O que buscamos Profissional Especialista de Dados com forte experiência em Microsoft Fabric e integração com soluções de IA.
Local
Barueri - SP
Presencial
Responsabilidades
- Arquitetar e implementar pipelines e estruturas de dados voltadas para habilitar sistemas de IA generativa, Copilot e modelos de machine learning.
- Desenhar e implementar pipelines de dados escaláveis no Microsoft Fabric para grandes volumes de dados.
- Otimizar fluxos de ingestão, transformação e orquestração para cenários de IA e agentes inteligentes.
- Garantir confiabilidade, performance e rastreabilidade dos dados em produção.
- Preparar e expor dados do Data Lake para consumo por sistemas de IA generativa e Microsoft Copilot.
- Implementar estratégias de personalização de dados para modelos de IA e assistentes conversacionais.
- Estruturar dados para maximizar relevância e qualidade em respostas de IA.
- Implementar arquiteturas modernas (Data Lakehouse, Medallion Architecture) no Fabric.
- Garantir qualidade, governança e consistência dos dados utilizados em modelos de ML.
- Configurar e otimizar índices de busca vetorial (Azure AI Search, Fabric).
- Implementar pipelines de embeddings e chunking para cenários RAG (Retrieval-Augmented Generation).
- Integrar busca semântica com modelos de IA.
- Desenvolver soluções em Python para processamento e análise de dados.
- Automatizar pipelines ETL/ELT com Fabric Notebooks, Spark e ferramentas de orquestração.
- Implementar testes de qualidade e validação de dados.
- Aplicar políticas de governança e segurança de dados.
- Gerenciar acessos, custos e performance dos pipelines.
- Produzir documentação técnica, incluindo diagramas e procedimentos.
- Colaborar com times de arquitetura, engenharia e segurança.
- Avaliar novas tecnologias e recomendar evolução do ambiente de dados.
Requisitos
- Experiência sólida com Microsoft Fabric (Data Engineering, Data Science, Real-Time Analytics).
- Forte conhecimento em Python (pandas, PySpark, scikit-learn, bibliotecas de IA).
- Domínio de SQL e modelagem de dados (Star Schema, Lakehouse).
- Experiência com Apache Spark e processamento distribuído.
- Vivência com pipelines ETL/ELT e orquestração de dados.
- Conhecimento em busca vetorial, embeddings e RAG.
- Experiência com Azure AI Services (Azure OpenAI, Cognitive Services).
- Experiência com versionamento (Git) e CI/CD para dados.
- Atuação 100% presencial – região Jd Paulistano/SP
Diferenciais
- Experiência com LLMs e fine-tuning de modelos.
- Conhecimento em frameworks de IA como LangChain e Semantic Kernel.
- Vivência com arquiteturas serverless e cloud-native.
- Experiência em otimização de custos em ambientes cloud.
- Contribuições em comunidades de Dados e IA.
- Certificações Recomendadas: DP600, Microsoft Fabric Analytics Engineer Associate, DP100, AI102, Designing and Implementing a Microsoft Azure AI Solution (desejável).
Carga horária
100% presencial