#CarreiraQueConecta 🚀❤️ Existimos para conectar desejos a realizações.
Local
São Paulo - SP
Presencial
Responsabilidades
- Monitorar continuamente ambientes de TI, garantindo a disponibilidade, performance e confiabilidade dos serviços.
- Implementar, configurar e manter ferramentas de observabilidade, incluindo Datadog (APM), Elasticsearch/Kibana, Zabbix, Grafana e Prometheus.
- Realizar instrumentação e coleta de métricas, logs e traces utilizando OpenTelemetry em ambientes distribuídos.
- Construir, evoluir e otimizar dashboards e painéis de monitoramento personalizados para diferentes times e necessidades do negócio.
- Definir e ajustar thresholds, alarmes e detecções de anomalias, assegurando alertas proativos e redução de incidentes.
- Correlacionar eventos e analisar dados para identificar causas de incidentes, antecipar falhas e recomendar ações preventivas.
- Atuar na sustentação e suporte das ferramentas de monitoração, garantindo o funcionamento contínuo e evolução da stack.
- Colaborar com times de engenharia, infraestrutura e produto para apoiar análises, decisões técnicas e respostas a incidentes.
- Propor, desenhar e implementar melhorias de eficiência operacional na plataforma de observabilidade, buscando evolução contínua.
- Documentar processos, configurações e boas práticas relacionadas à observabilidade.
Requisitos
- Experiência sólida em monitoração de infraestrutura e aplicações críticas.
- Domínio em Zabbix (configuração e administração), incluindo criação de templates, triggers, mapas e dashboards.
- Atuação com Datadog em contextos de APM (monitoramento de aplicações, análise de desempenho, rastreamento de transações e identificação de gargalos).
- Experiência com Elasticsearch e Kibana para sustentação, análise e gestão de logs.
- Familiaridade com OpenTelemetry para coleta e instrumentação de métricas, logs e traces em arquiteturas distribuídas (ex.: microserviços e containers).
- Capacidade de análise e correlação de eventos para identificação de incidentes, falhas e anomalias.
- Vivência com scripts de automação (Bash, Python ou PowerShell) para customização de alertas e integrações.
- Conhecimentos em ferramentas complementares de monitoração e observabilidade, como Grafana e Prometheus.
- Experiência com ambientes em nuvem (AWS, Azure ou OCI) e monitoramento de recursos cloud-native.
- Desejáveis: Conhecimento em boas práticas ITIL (gestão de incidentes, problemas e mudanças).
Benefícios
- Assistência médica
- Assistência odontológica
- Vale Refeição ou Alimentação
- Telemedicina
- Gympass
- Convênio com o Sesc
- Ajuda de custo para o home office
- PPR – Programa de Participação nos Resultados
- Previdência Privada
- Seguro de vida em grupo
- Convênio Farmácia
- Parcerias Educacionais
- Plataforma de Aprendizagem Online
- Descontos na Riachuelo
Processo seletivo
- Cadastro
- Teste Mindsight + Fit Cultural
- Entrevista com RH
- Entrevista com Gestor
- Case I Entrevista final
- Oferta
- Contratação
Sobre a empresa
A Riachuelo é uma das maiores empregadoras do país, atuando em moda, varejo, tech, logística, financeira e indústria.
Com mais de 30 mil colaboradores, a empresa busca criar impacto positivo no país e é conhecida por sua cultura acolhedora e empreendedora.
Etapas do processo
- Etapa 1: Cadastro
- Etapa 2: Teste Mindsight + Fit Cultural
- Etapa 3: Entrevista com RH
- Etapa 4: Entrevista com Gestor
- Etapa 5: Case I Entrevista final
- Etapa 6: Oferta
- Etapa 7: Contratação