Oportunidade: SRE -Site Reliability Engineering
Como SRE – Site Reliability Engineering, você será responsável por garantir que sistemas e serviços sejam confiáveis, escaláveis e eficientes
Híbrido
São Paulo - SP



Buscamos alguém que:
- Buscamos um profissional especializado em infraestrutura que tenha a habilidade de coletar métricas relevantes da jornada do cliente e transformá-las em monitoramento eficiente. Valorizamos um perfil proativo e construtivo, capaz de utilizar ferramentas avançadas para analisar a jornada do cliente, identificar lacunas e resolvê-las por meio de monitoramento proativo ou comunicação eficaz com a equipe de desenvolvimento.
- Ferramentas de Monitoramento e Observabilidade (Grafana, Prometheus, App Dynamic)
- Experiência com Dashboards, relatórios, FINOPS
- Gerenciamento de Configuração (Terraform, Ansible, Kubernetes, Docker)
- Automação e Scripting (Python, Bash, Shell Script)
- Ferramentas de Controle de Versão e Colaboração (GitLab)
- Comunicação e Colaboração (Google Meet, Jira, Confluence)
- Ferramentas de Análise de Logs e Incidentes (Splunk)
- Experiência na definição, monitoramento e análise de SLA, SLI e SLO
- Conhecimento e prática no provisionamento de serviços para AWS
- Experiência com Jenkins e troubleshoot de aplicações