Responsabilidades e atribuições
Realizar troubleshooting e análise funcional de incidentes em ambientes não produtivos;
Prestar suporte às aplicações em ambientes de testes;
Implementar e gerenciar ferramentas de monitoramento, garantindo visibilidade do desempenho dos sistemas e detecção proativa de problemas;
Liderar a resposta a incidentes, conduzindo análises pós-incidente (postmortem) para identificação de causa raiz e prevenção de recorrências;
Desenvolver scripts e ferramentas de automação para tarefas repetitivas, aumentando a eficiência operacional e reduzindo erros humanos;
Analisar a capacidade dos sistemas e planejar a escalabilidade, garantindo disponibilidade e performance dos serviços;
Colaborar com equipes de desenvolvimento para implementar mudanças de forma segura e eficiente, minimizando impactos no ambiente de homologação;
Atuar em conjunto com equipes de segurança, assegurando a integração das práticas de segurança ao ciclo de vida dos testes;
Criar e manter documentação técnica e guias operacionais, além de apoiar o treinamento das equipes em melhores práticas e ferramentas;
Trabalhar em parceria com analistas de QA, promovendo a melhoria contínua da confiabilidade e eficiência dos sistemas.
Requisitos e qualificações
Conhecimentos avançados em Kubernetes;
Sólida experiência com sistemas operacionais Linux;
Vivência em infraestrutura em nuvem;
Experiência com observabilidade (métricas, logs e tracing);
Conhecimento das práticas SRE e DevOps;
Experiência com ferramentas de observabilidade e monitoração, especialmente ELK Stack, incluindo criação de dashboards para sistemas monolíticos e distribuídos;
Conhecimento na operação de infraestrutura em ambientes distribuídos;
Experiência na construção de automações utilizando Python e Shell Script;
Vivência em troubleshooting de aplicações e infraestrutura, com foco em identificação de causa raiz;
Conhecimentos básicos em bancos de dados relacionais e não relacionais (Oracle, MongoDB, Cassandra e PostgreSQL);
Diferenciais: Experiência na operação de aplicações em OpenShift e arquiteturas de microsserviços; Conhecimento e operação do Axway API Gateway.
Não possui todos os requisitos para a vaga?
Está tudo bem! Na Compass UOL, estimulamos o desenvolvimento contínuo de novos talentos e transformamos desafios em oportunidades.
Informações adicionais
#remote
"remote"