Zyte tem liderado a construção de ferramentas poderosas para coleta, formatação e entrega de dados web, de forma rápida, confiável e em escala.
Local
Rio de Janeiro - RJ
Remoto
Responsabilidades
- Liderar a equipe de Core & MLOps Squad
- Desenvolver e evoluir a plataforma central (Kubernetes, Mesos, agendamento/autoescalonamento de GPU, computação distribuída)
- Gerenciar a plataforma de modelos: registro, rastreamento de experimentos, orquestração de treinamento, avaliação, serviço e monitoramento
- Construir o Golden Path: repositórios de referência, CLI de referência, pipelines CI/CD opinativos, contratos de tempo de execução (saúde/métricas/rastreamento/SLOs), clientes de alta performance, quebradores de circuito e outros padrões prontos para produção
- Operar uma plataforma de registro e treinamento de modelos segura e multi-tenant com gargalos padronizados de experimento/avaliação
- Fornecer padrões de serviço prontos para uso (online + batch), monitoramento de deriva/qualidade e playbooks de reversão
- Integrar capacidades de IA públicas/open-source como serviços de plataforma gerenciados com controles de custo e governança de dados
- Gerenciar a equipe: roadmap/priorização, entrega, mentoria e altos padrões de engenharia
- Fazer parceria com engenharia de produto (Zyte API, Scrapy Cloud), Prod Ops e Segurança em planos de adoção e implantação
- Mentorar a equipe e fomentar uma mentalidade de pensamento de plataforma
Requisitos
- 5+ anos de experiência construindo sistemas distribuídos; 3+ anos em MLOps/engenharia de plataforma de ML (ou impacto equivalente)
- Conhecimento de Linux/sistemas operacionais internos (modelo de processo, cgroups/namespaces), rede (TCP/IP, HTTP/2), concorrência e perfil de desempenho
- Compreensão profunda do Kubernetes (bônus: Mesos)
- Habilidade para desenvolver serviços de alta performance em Java, Rust, Go ou C++ (bônus: familiaridade com frameworks vert.x e Netty); fortes habilidades em Python
- Experiência com infraestrutura de GPU (agendamento, containerização, otimização)
- Histórico de design e operação de plataformas de modelos (registro, treinamento, serviço, monitoramento) em produção
- Sucesso demonstrado liderando equipes técnicas e implementando soluções de plataforma organizacionais
Diferenciais
- Experiência com Kafka mais Argo/Temporal/Airflow ou equivalentes
- Observabilidade baseada em eBPF, ferramentas de desempenho ou experiência com io_uring
- Otimização de custo para ML/IA; cotas e justiça multi-tenant
- Experiência prática na autoração de Golden Paths (service chassis/templates, blueprints CI/CD, CLI scaffolds)
- Práticas SRE (SLIs/SLOs, gerenciamento de incidentes)
Benefícios
- Fomentar e nutrir novas ideias e trazê-las ao mercado
- Fazer parte de uma equipe automotivada, progressiva e multicultural
- Ter liberdade e flexibilidade para trabalhar de onde você faz seu melhor trabalho, já que somos uma empresa totalmente remota
- Ter a oportunidade de trabalhar com tecnologias e ferramentas de código aberto de ponta
Sobre a empresa
Zyte tem ajudado milhares de organizações a tomar decisões de negócios mais inteligentes, garantir vantagem competitiva e impulsionar o crescimento sustentável.
Benefícios
- Fomentar e nutrir novas ideias e trazê-las ao mercado
- Fazer parte de uma equipe automotivada, progressiva e multicultural
- Ter liberdade e flexibilidade para trabalhar de onde você faz seu melhor trabalho, já que somos uma empresa totalmente remota
- Ter a oportunidade de trabalhar com tecnologias e ferramentas de código aberto de ponta