Cientista de Dados Junior Descrição da vaga A Leega é uma empresa focada no atendimento eficiente e inovador em seus clientes.
Local
São Paulo - SP
Remoto
Responsabilidades
- Aplicar técnicas estatísticas e algoritmos de Machine Learning para analisar grandes volumes de dados.
- Identificar padrões e construir modelos preditivos.
- Extrair insights acionáveis que suportam a tomada de decisão estratégica.
- Otimizar processos de negócio e impulsionar a inovação com soluções baseadas em dados.
- Atuar na interface entre os desafios do negócio e a implementação técnica no ambiente Azure Databricks.
- Contribuir com análises iniciais, insights e propostas de modelos para solucionar desafios de dados e IA.
- Trabajar em sinergia com Engenheiros de Dados e Arquitetos para garantir a disponibilidade dos dados e o treinamento eficiente dos modelos.
- Realizar a limpeza, transformação, padronização e enriquecimento de dados brutos utilizando o poder de processamento do Azure Databricks e Spark.
- Conduzir a Análise Exploratória de Dados (EDA) para entender distribuições, identificar outliers e selecionar features relevantes.
- Construir, treinar e validar modelos preditivos utilizando frameworks de Ciência de Dados.
- Documentar e apresentar os resultados e métricas de desempenho dos modelos.
- Auxiliar na transição dos modelos desenvolvidos para ambientes de produção.
- Acompanhar a qualidade, integridade e drift dos dados e o desempenho dos modelos em produção.
Requisitos
- Conhecimento e experiência prática na utilização de Azure Databricks.
- Experiência em consumir dados de Data Lakes e estruturar dados para o consumo de modelos.
- Linguagens de programação: Python (Imprescindível) para manipulação de dados e desenvolvimento de modelos.
- Experiência prática com as principais bibliotecas e frameworks de ML/IA.
- Noções de uso do MLflow para rastreamento e versionamento de modelos e experimentos.
- Proficiência em SQL/Spark SQL para consulta e manipulação de dados em larga escala.
- Experiência com ferramentas para CI/CD e automação de fluxos de machine learning.
- Conhecimento em SQL.
- Capacidade de gerenciar Data Lakes para preparação de dados de IA, com foco em Azure Databricks.
- Conhecimento em Modelagem de IA.
- Implementação de pipelines automatizados para treinamento, validação, deployment e monitoramento de modelos de IA.
- Capacidade de definir e gerenciar repositórios de features para modelos de IA.
Diferenciais
- Conhecimento de LGPD/GDPR para garantir conformidade regulatória no tratamento de dados para IA.
- Experiência de trabalho com metodologias ágeis (Scrum/Kanban).
- Capacidade de entender requisitos de negócio e convertê-los em soluções técnicas para IA.
Benefícios
- Convênio Médico Porto Seguro.
- Convênio Odontológico Porto Seguro.
- Participação nos Lucros e Resultados (PLR).
- Auxílio Creche.
- Vale Alimentação e Refeição Alelo.
- Auxílio Home Office.
- Parcerias com Instituições de Ensino.
- Incentivo para Certificações, inclusive em Cloud.
- Pontos Livelo.
- TotalPass.
- Mindself.
Processo seletivo
- Cadastro
- Mapeamento Comportamental
- Avaliação de Perfil
- Entrevista Gestor
- Entrevista Cliente
- Contratação
Sobre a empresa
A LEEGA é referência em consultoria e outsourcing para soluções de Data Analytics.
Temos 15 ANOS de mercado e mais de 20 ANOS de experiência em soluções de Business Intelligence, Data Integration e Analytics, atendendo grandes empresas dos mais diversos segmentos do mercado e contamos com mais de 580 colaboradores.
Brasileiros, com escritório de projetos, fábrica de software e centro de treinamento em São Paulo (capital) , atuação internacional com escritório também em Portugal, somos conhecidos por viver e respirar Analytics e Big Data, inovando nossa tecnologia, compartilhando conhecimento, evoluindo talentos e entregando VALOR.