Um caos informático sem precedentes surgiu no dia 19 de julho, quando um erro de carregamento do Windows afectou um número significativo de computadores. Os números podem não parecer tão alarmantes à primeira vista, uma vez que se estima que tenha afetado 1% dos computadores com este sistema operativo em todo o mundo.
Mas o ecrã azul paralisou sistemas importantes, públicos e privados, em todo o planeta interligado, pelo que o problema foi elevado a sistémico em poucos minutos.
Como rapidamente se soube, e a Microsoft deve ter-se preocupado ativamente que tal acontecesse, o bug teve origem após uma atualização do serviço de segurança informática da CrowdStrike, um fornecedor de cibersegurança do gigante de Silicon Valley, entre outras empresas. Esta ferramenta foi concebida para bloquear o acesso de malware e a infeção de sistemas e computadores.
A própria empresa, através do seu fundador George Kurtz, foi rápida a descartar a hipótese de um ciberataque ou de uma falha de segurança como ponto de partida. Como se veio a saber ao longo do dia, tudo começou com o sensor Falcon do serviço e com um erro numa nova versão, implementada nas primeiras horas da manhã.
Concorrência de causas
Neste ponto, é possível falar de uma concorrência de causas.
O direto O problema era um problema no código do sensor, ou seja, com uma componente significativa de erro humano. Mas esta situação foi agravada pelaincapacidade do software de teste para detetar o problema antes da validação e da produção e, indiretamente, pela ineficácia dos controlos e procedimentos de qualidade e de teste que fazem parte da estratégia preventiva.
Como resultado, um sensor de uma solução de segurança instável (de uma das empresas dominantes na área) que tem impacto em computadores ligados a serviços cloud da Microsoft como o Microsoft 365, Microsoft Azure ou Microsoft Teams entre outros.
A natureza do erro, o ecrã azul e o reinício contínuo dos computadores, dificultou também a resolução do incidente por parte dos técnicos devido à impossibilidade de acederem remotamente aos equipamentos.
Empresas de todos os sectores afectadas
As consequências tiveram um impacto negativo em praticamente todos os sectores e a nível mundial, ao ponto de provocar aquilo a que Troy Hunt, diretor do portal de cibersegurança HaveIBeenPwned, chamou “o maior apagão informático da história”.
O tráfego aéreo viveu um dia muito complicado em todo o mundo, com problemas nos sistemas dos gestores dos aeroportos e das companhias aéreas.
Em Espanha, a AENA confirmou mais de 400 voos cancelados e milhares de voos atrasados no mesmo dia do incidente , tudo isto num dos períodos mais intensos em termos de voos.
Também em Espanha, os sistemas de saúde de diferentes comunidades autónomas e redes hospitalares privadas sofreram incidentes significativos, desde o “apagão” de ficheiros de doentes até à paralisação de ferramentas de gestão de indicadores de UCI em vários centros, o que obrigou à implementação de soluções alternativas e, em muitas ocasiões, ao regresso ao papel e à caneta.
Em todo o mundo, centenas de empresas comunicaram que a sua atividade tinha sido afetada.
Só em Espanha.
Nomes como VISA, Unicaja, Movistar, Google, Santander España, Correos, Vueling ou Repsol são apenas alguns deles e dão uma ideia aproximada da magnitude do acidente, da dificuldade de o evitar e de restabelecer a normalidade, da profunda interligação em que se desenvolvem as operações do dia e das perdas económicas que um erro sistémico pode causar em qualquer sector de atividade.