El pasado 19 de julio se desató un caos informático sin precedentes al producirse un error en la carga de Windows que afectó a un número significativo de ordenadores. Las cifras, a priori, podrían no parecer tan alarmantes, ya que se calcula que afectó al 1 % de los equipos que corren bajo este sistema operativo en todo el mundo. Pero la pantalla azul paralizó sistemas importantes, públicos y privados, en todo el planeta interconectado, por lo que el problema se elevó en minutos a la categoría de sistémico.
Como se supo pronto, algo que seguramente Microsoft se preocupó activamente de que ocurriera, el error se originó tras efectuar una actualización del servicio de seguridad informática de CrowdStrike, proveedor de ciberseguridad del gigante de Silicon Valley entre otras empresas. Esta herramienta tiene como misión bloquear el acceso de malware a sistemas y equipos y, por tanto, su infección.
La propia compañía, a través de su fundador George Kurtz, descartó con rapidez las hipótesis de un ciberataque o de un fallo de seguridad como punto de partida. Como se conoció a lo largo del día, todo se inició en el sensor Falcon del servicio y en un error en una nueva versión, desplegada esa madrugada.
Concurrencia de causas
En este punto se puede hablar de una concurrencia de causas. La directa fue un problema en el código del sensor, es decir, con un componente importante de error humano. Pero a esta causa se le unió la incapacidad del software de prueba para detectar la incidencia antes de su validación y puesta en producción e, indirectamente, la ineficacia de los controles y procedimientos de calidad y testeo que forman parte de la estrategia preventiva.
Como resultado, un sensor de una solución de seguridad inestable (de una de las empresas dominantes en el área) que impacta en equipos conectados a servicios en la nube de Microsoft como Microsoft 365, Microsoft Azure o Microsoft Teams entre otros. La naturaleza del error, la pantalla azul y el reinició continuo de las computadoras, también dificultó la subsanación de la incidencia por la imposibilidad de acceder a los equipos de manera remota por parte de los técnicos.
Compañías de todos los sectores afectadas
Las consecuencias impactaron negativamente en prácticamente todos los sectores y a nivel global, hasta tal punto de provocar lo que Troy Hunt, responsable del portal sobre ciberseguridad HaveIBeenPwned, calificó como «el mayor apagón informático de la historia».
El tráfico aéreo vivió una jornada muy complicada en todo el mundo, con problemas en los sistemas de los gestores aeroportuarios y de las aerolíneas. En España, AENA confirmó en la misma jornada de la incidencia más de 400 vuelos cancelados y miles de ellos retrasados, todo esto en una de las épocas de más intensidad en lo que a vuelos se refiere.
También en nuestro país los sistemas sanitarios de diferentes comunidades autónomas y redes de hospitales privados sufrieron incidencias relevantes, desde el “apagón” de los expedientes de los pacientes hasta la paralización de herramientas que gestionan los indicadores de las UCI de varios centros, lo que obligó a poner en marcha soluciones alternativas y, en muchas ocasiones, volver al bolígrafo y el papel.
A lo largo de todo el mundo, cientos de compañías informaron de que su actividad se había visto afectada. Solo en España. nombres como VISA, Unicaja, Movistar, Google, Santander España, Correos, Vueling o Repsol son solo algunos y dan una idea aproximada de la magnitud de la caída, la dificultad para prevenirla y restaurar la normalidad, la profunda interconexión en la que se opera en el día y las pérdidas económicas que puede provocar un error sistémico en cualquier sector de actividad.