Core & ML Ops Team Lead

📍 Rio de Janeiro - RJ Publicado 06/11/2025 Área: Gerente de Infraestrutura de ML

Entre ou cadastre-se para liberar a candidatura

Faça login para acessar o link e 74.372 vagas ativas.

  • Link original liberado
  • Alertas de vagas
  • Favoritas salvas

Sem custo — leva cerca de 1 minuto.

Zyte tem liderado a construção de ferramentas poderosas para coleta, formatação e entrega de dados web, de forma rápida, confiável e em escala.

Local

Rio de Janeiro - RJ

Remoto

Responsabilidades

  • Liderar a equipe de Core & MLOps Squad
  • Desenvolver e evoluir a plataforma central (Kubernetes, Mesos, agendamento/autoescalonamento de GPU, computação distribuída)
  • Gerenciar a plataforma de modelos: registro, rastreamento de experimentos, orquestração de treinamento, avaliação, serviço e monitoramento
  • Construir o Golden Path: repositórios de referência, CLI de referência, pipelines CI/CD opinativos, contratos de tempo de execução (saúde/métricas/rastreamento/SLOs), clientes de alta performance, quebradores de circuito e outros padrões prontos para produção
  • Operar uma plataforma de registro e treinamento de modelos segura e multi-tenant com gargalos padronizados de experimento/avaliação
  • Fornecer padrões de serviço prontos para uso (online + batch), monitoramento de deriva/qualidade e playbooks de reversão
  • Integrar capacidades de IA públicas/open-source como serviços de plataforma gerenciados com controles de custo e governança de dados
  • Gerenciar a equipe: roadmap/priorização, entrega, mentoria e altos padrões de engenharia
  • Fazer parceria com engenharia de produto (Zyte API, Scrapy Cloud), Prod Ops e Segurança em planos de adoção e implantação
  • Mentorar a equipe e fomentar uma mentalidade de pensamento de plataforma

Requisitos

  • 5+ anos de experiência construindo sistemas distribuídos; 3+ anos em MLOps/engenharia de plataforma de ML (ou impacto equivalente)
  • Conhecimento de Linux/sistemas operacionais internos (modelo de processo, cgroups/namespaces), rede (TCP/IP, HTTP/2), concorrência e perfil de desempenho
  • Compreensão profunda do Kubernetes (bônus: Mesos)
  • Habilidade para desenvolver serviços de alta performance em Java, Rust, Go ou C++ (bônus: familiaridade com frameworks vert.x e Netty); fortes habilidades em Python
  • Experiência com infraestrutura de GPU (agendamento, containerização, otimização)
  • Histórico de design e operação de plataformas de modelos (registro, treinamento, serviço, monitoramento) em produção
  • Sucesso demonstrado liderando equipes técnicas e implementando soluções de plataforma organizacionais

Diferenciais

  • Experiência com Kafka mais Argo/Temporal/Airflow ou equivalentes
  • Observabilidade baseada em eBPF, ferramentas de desempenho ou experiência com io_uring
  • Otimização de custo para ML/IA; cotas e justiça multi-tenant
  • Experiência prática na autoração de Golden Paths (service chassis/templates, blueprints CI/CD, CLI scaffolds)
  • Práticas SRE (SLIs/SLOs, gerenciamento de incidentes)

Benefícios

  • Fomentar e nutrir novas ideias e trazê-las ao mercado
  • Fazer parte de uma equipe automotivada, progressiva e multicultural
  • Ter liberdade e flexibilidade para trabalhar de onde você faz seu melhor trabalho, já que somos uma empresa totalmente remota
  • Ter a oportunidade de trabalhar com tecnologias e ferramentas de código aberto de ponta

Sobre a empresa

Zyte tem ajudado milhares de organizações a tomar decisões de negócios mais inteligentes, garantir vantagem competitiva e impulsionar o crescimento sustentável.

Benefícios

  • Fomentar e nutrir novas ideias e trazê-las ao mercado
  • Fazer parte de uma equipe automotivada, progressiva e multicultural
  • Ter liberdade e flexibilidade para trabalhar de onde você faz seu melhor trabalho, já que somos uma empresa totalmente remota
  • Ter a oportunidade de trabalhar com tecnologias e ferramentas de código aberto de ponta