Principais responsabilidades
Administrar, suportar e monitorar ambientes Cloud e On-Premise de alta disponibilidade, com foco em confiabilidade, escalabilidade, observabilidade e automação;
Implementar e manter pipelines de automação utilizando Ansible e Ansible AWX para provisionamento, configuração e manutenção de infraestrutura;
Administrar e otimizar ambientes conteinerizados utilizando Docker;
Gerenciar a infraestrutura em AWS, incluindo serviços essenciais relacionados a computação, rede, armazenamento e segurança;
Configurar, manter e evoluir soluções de monitoramento e observabilidade utilizando ferramentas como Zabbix, Grafana, OpenSearch e Prometheus;
Monitorar performance, disponibilidade e incidentes, atuando na investigação, mitigação e prevenção de falhas;
Realizar auditoria, gestão contínua de vulnerabilidades e melhoria contínua de ambientes e processos;
Propor e implementar soluções técnicas que aumentem a eficiência, automação e confiabilidade dos serviços;
Reportar-se à gerência apresentando métricas, indicadores e evolução da maturidade de SRE na companhia.
Formação e experiência
Graduação completa ou em andamento em Tecnologia da Informação, Sistemas de Informação, Engenharia de Software, Computação ou áreas correlatas;
Experiência prévia em administração de ambientes de infraestrutura, com foco em SRE, automação e cloud.
Requisitos Obrigatórios
Conhecimentos intermediários em Linux (administração, troubleshooting e otimização);
Conhecimento intermediário e experiência prática com AWS;
Experiência com ferramentas de monitoramento e observabilidade (Zabbix, Grafana e Prometeus);
Bom raciocínio lógico com capacidade de automação e resolução de problemas usando Python e Shell Script;
Diferenciais
Experiência com práticas e cultura SRE (Site Reliability Engineering);
Bons conhecimentos em banco não relacional (OpenSearch/Elasticsearch);
Conhecimento e experiência com Ansible e Ansible AWX;
Vivência com pipelines de CI/CD e cultura DevOps;
Conhecimento em Elastic Stack/Opensearch (Elasticsearch, Kibana, Logstash, Opensearch-indexer, Opensearch-dashboards Beats);
Experiência em ambientes de virtualização;
Conhecimentos em Segurança da Informação e conceitos de Zero Trust;
Cultura Agile / SCRUM.
Conhecimentos intermediários em Docker.
Competências comportamentais
Proatividade e foco em resultados;
Capacidade de comunicação e interação com múltiplas áreas;
Dinamismo, flexibilidade e autonomia na condução de demandas;
Visão sistêmica para análise de riscos, disponibilidade e desempenho;
Motivação por desafios e melhoria contínua.