May 09, 2024
Pager Duty CPO: operações digitais maduras (automatizadas) salvam a incidência de incidentes
As últimas tendências em desenvolvimento de software da Computer Weekly Application Developer Network. Este é um post convidado para a Computer Weekly Developer Network, escrito por Sean Scott em sua qualidade
As últimas tendências em desenvolvimento de software da Computer Weekly Application Developer Network.
Este é um post convidado para a Computer Weekly Developer Network escrito por Sean Scott na qualidade de diretor de produto (CPO) da PagerDuty – a empresa é conhecida por sua plataforma de operações em tempo real que integra dados de máquina e inteligência humana para melhorar a visibilidade e agilidade nas organizações.
A automação alimentada por IA tem um papel crucial a desempenhar em ambientes de TI mais defensivos, tendo em conta o risco, a escassez de mão-de-obra, a interrupção da cadeia de abastecimento e a segurança – ajuda a impulsionar o encaminhamento eficiente de eventos, proteger processos, reduzir tarefas manuais intensivas em mão-de-obra e melhorar a segurança e a experiência do cliente.
Mas para permitir a automação alimentada por IA, as organizações necessitam de operações digitalmente maduras para implementar a automação de incidentes para unir departamentos isolados de segurança e TI, ao mesmo tempo que proporcionam segurança organizacional melhorada e fluxos de trabalho simplificados... então, como podemos fazer isto e chegar a um futuro melhor?
Scott escreve na íntegra o seguinte…
Ao automatizar o gerenciamento de incidentes, como detecção e priorização, a automação reduz o tempo necessário para responder e resolver incidentes, reduzindo erros humanos e garantindo maior precisão no gerenciamento de incidentes.
A automação de incidentes também libera tempo para as equipes de TI, reduzindo o tempo e o estresse gastos em tarefas manuais e, portanto, reduzindo o desgaste e a rotatividade de funcionários. Ele permite que as equipes de TI se concentrem em inovações importantes, o que é particularmente crítico em momentos em que há menos orçamento empresarial disponível.
Apesar do valor da gestão automatizada de incidentes, as tarefas manuais continuam a ser comuns em muitas organizações. Um estudo conduzido pela Forrester descobriu que os profissionais de implantação e entrega de aplicativos “ainda estão continuamente sobrecarregados com o número de tarefas manuais e o volume de trabalho”.
Em nosso mais recente Relatório sobre o Estado das Operações Digitais, 14% dos entrevistados classificaram suas equipes como “Manuais” ou “Reativas” e nove em cada dez líderes seniores de TI e desenvolvimento criticaram as abordagens atuais de ITOps, observando que as equipes estão gastando quase metade de seu tempo lidando com com incidentes em vez de inovar, totalizando um impacto financeiro de mais de US$ 3 milhões por empresa por ano.
Os trabalhadores manuais utilizam uma variedade de ferramentas de monitorização, com elevada sobrecarga de gestão. As configurações de regras devem ser mantidas, aumentando o esforço necessário para processar dados de eventos e os dados devem ser organizados em vários sistemas isolados.
Os principais afetados são o tempo médio de resolução (MTTR) e o tempo médio entre incidentes (MTBI), porque os sistemas isolados de resposta a incidentes e os processos manuais sobrecarregam as equipes de operações digitais. Isso leva a um ciclo vicioso de altas cargas de trabalho, rotatividade de funcionários e baixo desempenho. Os entrevistados no relatório Nosso Estado das Operações Digitais detalharam alguns dos impactos qualitativos que o aumento da rotatividade teve sobre eles e suas equipes. Incluídos nas suas respostas estavam “mais turnos de plantão”, “maior carga de trabalho” e “maior MTTR”.
Uma grande ameaça à segurança de uma organização é o esgotamento dos funcionários, que ocorre quando as equipes de resposta a incidentes respondem manualmente para lidar com as ameaças. De acordo com o relatório Global Incident Response Threats da VMWare, 69% dos entrevistados apresentam sintomas de esgotamento e pensaram em deixar o trabalho e vemos isso em nossos dados. O aumento das notificações noturnas para atendentes de plantão levará à demissão dos funcionários.
Da mesma forma, o relatório PagerDuty conclui que os entrevistados têm menos tempo para descansar entre os turnos de plantão e aumentam as responsabilidades profissionais. Também descobriu que os socorristas sobrecarregados e esgotados estão arcando com o fardo das interrupções fora do horário comercial em todos os setores e em todos os segmentos de receita.
O estudo também descobriu que organizações de todos os tamanhos e de todos os setores são deficientes na resposta a incidentes, um problema agravado por processos manuais. O ruído de alerta é outra constante em muitas organizações, distraindo os socorristas que poderiam estar gastando seu tempo de forma mais produtiva. Esse atrito leva inevitavelmente a uma experiência inferior do cliente, a uma arquitetura mais fraca e a menos tempo para inovação.