DevOps SRE

📍 São Paulo - SP Publicado 15/09/2025 Área: DevOps SRE
Entre ou cadastre-se para ver como se candidatar É gratuito: mostramos o link original e alertas de vagas parecidas.
Por que criar sua conta?
  • Ver o link original e candidatar-se em 1 clique
  • Receber alertas de vagas parecidas
  • Salvar e acompanhar vagas favoritas

¡Sé parte de Stefanini! Stefanini é formada por mais de 30.000 profissionais, conectados em 41 países, fazendo o que mais amam e co-criando um futuro melhor.

Local

São Paulo - SP

Não especificado

Responsabilidades

  • Implementar uma terceira zona de disponibilidade na nuvem AWS, cumprindo as boas práticas de nuvem e os padrões do projeto.
  • Analisar o serviço e os componentes de infraestrutura para melhorar a sua disponibilidade, desempenho, manutenibilidade e resiliência.
  • Criar e projetar sistemas robustos, prever possíveis falhas e configurar automações para melhorar a resiliência e redundância do sistema.
  • Manter e melhorar a infraestrutura de TI e seus componentes, incluindo a automação de tarefas por meio de ferramentas e codificação.
  • Estandardizar, documentar e divulgar as políticas, práticas e ferramentas de observabilidade que apoiem a implementação de SRE.
  • Implementar métricas

Requisitos

  • Formação Requerida: Engenharia de Sistemas, Engenharia de Software, Engenharia da Informação ou outras engenharias afins.
  • Formação Complementária (Preferível): AWS Certified Cloud Practitioner
  • Cursos em Engenharia de Fiabilidade do Site (SRE, site reliability engineering)
  • 2 anos em DevOps ou em Engenharia de Fiabilidade do Site (SRE, site reliability engineering)
  • Competências Técnicas: Inglês Técnico.
  • Conhecimento em Engenharia de Fiabilidade do Site (SRE, site reliability engineering).
  • Conhecimento avançado em ferramentas de observabilidade.
  • Conhecimento de métricas de observabilidade, disponibilidade e SLAs.
  • Conhecimentos médio-altos em ferramentas para automação.
  • Conhecimentos avançados em infraestrutura na nuvem AWS.
  • Conhecimentos em práticas de resiliência e recuperação ante desastres.
  • Conhecimentos em ferramentas ofimáticas.
  • Conhecimentos de Kubernetes.
  • Conhecimentos de Terraform.
  • Conhecimentos de GitLab.
  • Conhecimentos de NewRelic.
  • Conhecimento básico de gestão do serviço ITIL.

Faixa salarial

Não especificado

Carga horária

Não especificado

Tipo de contrato

Não especificado

Sobre a empresa

Responsabilidades e atribuições: Implementar uma terceira zona de disponibilidade na nuvem AWS, alcançando um equilíbrio ótimo entre a confiabilidade e a estabilidade dos serviços.

Ademais, contribui para a melhoria da infraestrutura geral existente na nuvem a partir da configuração de automações para favorecer a robustez, predição de falhas, melhorar a resiliência, a redundância e a otimização de custos do sistema.

FUNÇÕES: Implementar uma terceira zona de disponibilidade na nuvem AWS, cumprindo as boas práticas de nuvem e os padrões do projeto.

Implementar métricas-chave de SRE que permitam medir a eficácia do processo e promover a melhoria contínua.

Otimizar custos em todas as contas de nuvem para manter um bom desempenho sem ter serviços ou plataforma ociosa.

Implementar e manter as melhores práticas para continuidade de negócios de cara a testes DRP.

Automatizar tarefas operacionais e repetitivas que contribuam para a eficiência e estabilidade da infraestrutura na nuvem.

Contribuir para a resiliência da infraestrutura a partir da predição de cenários de falha, folhas de rotas para sua atenção e definição de planos de melhoria.

Proponer planos de ação e apoiar sua implementação para a solução de causa raiz de incidentes produtivos, garantindo o adequado registro dos mesmos.

Desenvolver ferramentas de automação para supervisionar sistemas, gerenciar incidentes e realizar tarefas operacionais de TI.

Apoiar o design e execução de testes de recuperação ante desastres, garantindo o adequado registro dos mesmos.

Implementar mudanças e atualizações de software para seu lançamento em um ambiente de produção.

Gerenciar a entrega/implementação contínua por meio de ferramentas de automação.

Construir e operar capacidades de integração contínua (CI) quando necessário empregando o controle de versões do código-fonte e artefatos relacionados.

Controlar sistematicamente as mudanças de uma configuração e manter a integridade, a coerência e a rastreabilidade de tal configuração ao longo do ciclo de vida do projeto, sistema e/ou serviço.

Armazenar os documentos gerados durante o passo a produção dos requisitos do projeto, de acordo com o definido no plano de implementação e configuração.

Garantir que os requisitos de segurança e privacidade sejam uma parte essencial da construção e integração dos sistemas.

Testar, validar e aprovar a integração a fim de satisfazer os requisitos, as arquiteturas e o design.

Controlar as atividades de integração e registrar e informar sobre os resultados da integração.

Participar ativamente na atualização documental dos processos nos quais participa.

Participar nas reuniões diárias de acompanhamento, assim como nas reuniões programadas por seu chefe imediato.

Atualizar a base de conhecimento com as lições aprendidas, assim como comunicar os resultados ao equipe de trabalho.

Conhecer e cumprir as normas e procedimentos de segurança estabelecidos pelo projeto e pelos entes de controle.