Local: Híbrido | Barueri - SP Descrição da vaga.
Local
Barueri - SP
Híbrido
Responsabilidades
- Acompanhar a fila de chamados e alertas via ServiceNow
- Atuar na análise e tratativa de incidentes de Nível 1 relacionados a demandas de SRE
- Executar atividades de restart e recuperação de ambientes e serviços
- Monitorar sistemas, aplicações e infraestrutura, garantindo a estabilidade dos serviços
- Analisar logs de ferramentas e aplicações (como Dynatrace) para identificação de falhas e causas raiz
- Montar e liderar salas de crise em cenários de incidentes críticos
- Escalar incidentes para times internos e fornecedores, quando necessário
- Realizar abertura de chamados com fornecedores e acompanhar tratativas
- Efetuar follow-up com stakeholders e executivos sobre status de incidentes
- Apoiar na comunicação clara e objetiva durante situações de criticidade
- Contribuir para a melhoria contínua dos processos de monitoração e resposta a incidentes
Requisitos
- Ensino superior completo em áreas de Tecnologia da Informação ou correlatas
- Experiência prévia com monitoramento de ambientes, sistemas e aplicações
- Conhecimento em rotinas de SRE (microserviços, pipelines e Kubernetes)
- Experiência com cultura DevOps e SRE
- Conhecimento em Cloud AWS
- Experiência com ferramentas de monitoramento e troubleshooting (ex: Dynatrace)
- Conhecimento em Linux
- Vivência na análise e interpretação de logs e alertas
- Experiência em atuação com incidentes e ambientes críticos
- Disponibilidade para atuar em escala 12X36 (turno noturno – 19h às 7h)
- Desejáveis: Experiência prévia em Command Center ou NOC; Vivência com ferramentas adicionais de monitoração (ex: Grafana, Datadog)
Carga horária
12X36 (turno noturno – 19h às 7h)
Processo seletivo
- Cadastro
- Mapeamento de Stack
- Fit Cultural
- Entrevista Líder
- Oferta e Negociação
- Contratação