Cientista de Dados Pleno Descrição da vaga A Leega é uma empresa focada no atendimento eficiente e inovador em seus clientes.
Local
São Paulo - SP
Remoto
Responsabilidades
- Compreender as Necessidades do Negócio e Requisitos de ML/IA: Colaborar com stakeholders e Cientistas de Dados Sêniores para entender os problemas de negócio da Porto Seguro e traduzi-los em hipóteses testáveis e projetos de Machine Learning.
- Participar de Discussões Baseadas em Dados e IA: Contribuir com análises iniciais, insights e propostas de modelos para solucionar desafios de dados e IA.
- Interface entre Times de Tecnologia e Data Science: Trabalhar em sinergia com Engenheiros de Dados e Arquitetos para garantir a disponibilidade dos dados e o treinamento eficiente dos modelos.
- Preparação e Exploração de Dados no Azure Databricks: Realizar a limpeza, transformação, padronização e enriquecimento de dados brutos utilizando o poder de processamento do Azure Databricks e Spark.
- Conduzir a Análise Exploratória de Dados (EDA) para entender distribuições, identificar outliers e selecionar features relevantes ( Feature Engineering ).
- Desenvolvimento e Validação de Modelos de ML: Construir, treinar e validar modelos preditivos (regressão, classificação, clustering ) utilizando frameworks de Ciência de Dados como Scikit-Learn, TensorFlow ou PyTorch.
- Documentar e apresentar os resultados e métricas de desempenho dos modelos (e.g., AUC, F1-Score).
- Apoiar a Operacionalização (MLOps): Auxiliar na transição dos modelos desenvolvidos para ambientes de produção, utilizando ferramentas como MLflow para rastreamento e gerenciamento de experimentos e modelos no Azure Databricks.
- Monitoramento da Qualidade dos Dados e Modelos: Acompanhar a qualidade, integridade e drift dos dados e o desempenho dos modelos em produção, propondo ajustes quando necessário.
Requisitos
- Arquitetura e Ferramentas de Dados: Foco em Azure Databricks: Conhecimento e experiência prática na utilização de Azure Databricks para processamento e análise de dados, incluindo a utilização de notebooks (Python/Spark) e gerenciamento de clusters.
- Feature Store/Data Lake: Entendimento do conceito de Feature Store e experiência em consumir dados de Data Lakes (preferencialmente Azure Data Lake Storage) e estruturar dados para o consumo de modelos.
- Programação e Frameworks de Ciência de Dados: Linguagens: Python (Imprescindível) para manipulação de dados ( Pandas, NumPy ) e desenvolvimento de modelos.
- Frameworks de ML/IA (Foco em Treinamento): Experiência prática com as principais bibliotecas e frameworks como Scikit-Learn (modelos clássicos), TensorFlow/Keras ou PyTorch (para aprendizado profundo) e bibliotecas como XGBoost/LightGBM.
- Gestão de Experimentos: Noções de uso do MLflow para rastreamento e versionamento de modelos e experimentos no ambiente Databricks.
- Consultas e Transformação: Proficiência em SQL/Spark SQL para consulta e manipulação de dados em larga escala.
- Observabilidade de Dados.
- Familiaridade com ferramentas de monitoramento e validação de dados, Orquestração de Pipelines.
- Bancos de Dados e Armazenamento de Dados: Conhecimento em SQL.
- Data Lakes e Data Warehouses: Capacidade de gerenciar Data Lakes para preparação de dados de IA, com foco em Azure Databricks.
- Armazenamento de Features.
- Cloud e Infraestrutura Nuvem: Azure + Databricks.
- Conhecimento em Modelagem de IA: Capacidade de colaborar com os demais Cientistas de Dados para preparar conjuntos de dados para modelos de IA, garantindo alta qualidade e performance.
- MLOps: Implementação de pipelines automatizados para treinamento, validação, deployment e monitoramento de modelos de IA.
- Gestão de Features: Capacidade de definir e gerenciar repositórios de features para modelos de IA (Feature Engineering).
- Conhecimentos Complementares Privacidade e Segurança de Dados: Conhecimento de LGPD/GDPR para garantir conformidade regulatória no tratamento de dados para IA.
- Metodologias Ágeis: Experiência de trabalho com metodologias ágeis (Scrum/Kanban).
- Capacidade Analítica: Capacidade de entender requisitos de negócio e convertê-los em soluções técnicas para IA.
Benefícios
- Convênio Médico Porto Seguro Cuidado completo para você e sua família, com possibilidade de incluir cônjuge e filhos.
- Convênio Odontológico Porto Seguro Proteção odontológica para você e seus dependentes.
- Participação nos Lucros e Resultados (PLR) Reconhecimento pelo seu trabalho e contribuição para o sucesso da empresa.
- Auxílio Creche Suporte financeiro para que pais e mães cuidem dos pequenos com tranquilidade.
- Vale Alimentação e Refeição Alelo Garantindo refeições práticas e confortáveis no seu dia a dia.
- Auxílio Home Office Incentivo para que você tenha um espaço de trabalho confortável em casa.
- Parcerias com Instituições de Ensino Educação ao seu alcance, com descontos e incentivos em cursos e graduações.
- Incentivo para Certificações, inclusive em Cloud Avance sua carreira com certificações nas principais tecnologias como: GCP, Azure, AWS entre outras.
- Pontos Livelo Acumule pontos e use como preferir, com total liberdade de escolha.
- TotalPass Incentivo à saúde com planos de academia com desconto para colaboradores e familiares.
- Mindself Incentivo à melhorar a qualidade de vida através de meditação e o Mindfulness.
Carga horária
Modelo Remoto
Processo seletivo
- Cadastro
- Mapeamento Comportamental
- Avaliação de Perfil
- Entrevista Gestor
- Entrevista Cliente
- Contratação
Sobre a empresa
A LEEGA é referência em consultoria e outsourcing para soluções de Data Analytics.
Temos 15 ANOS de mercado e mais de 20 ANOS de experiência em soluções de Business Intelligence, Data Integration e Analytics, atendendo grandes empresas dos mais diversos segmentos do mercado e contamos com mais de 580 colaboradores.
Conquistamos capacidade técnica e reunimos as melhores pessoas para proporcionar aos nossos clientes a melhor experiência.
Brasileiros, com escritório de projetos, fábrica de software e centro de treinamento em São Paulo (capital) , atuação internacional com escritório também em Portugal, somos conhecidos por viver e respirar Analytics e Big Data, inovando nossa tecnologia, compartilhando conhecimento, evoluindo talentos e entregando VALOR.