Enable javascript in your browser for better experience. Need to know to enable it? Go here.

Después de CrowdStrike: Navegando el camino hacia la resiliencia digital

La interrupción de CrowdStrike en julio de 2024 desató un caos digital a una escala sin precedentes. En cuestión de horas, 8.5 millones de sistemas colapsaron en todo el mundo, paralizando negocios, gobiernos e infraestructuras críticas.

 

Aunque el incidente destaca la creciente complejidad de nuestros sistemas de software, para los líderes empresariales y tecnológicos la pregunta es simple: ¿cómo evito que esto vuelva a suceder?

 

CrowdStrike podría ser único, pero los fallos son inevitables

 

Desafortunadamente, la realidad es que no existe una salvaguarda integral contra incidentes que causen una interrupción significativa. Intentar encontrar una causa raíz única —culpando a pruebas inadecuadas, patrones de integración del kernel o pipelines de despliegue defectuosos— podría ser tentador, pero es muy probable que la próxima gran interrupción provenga de una fuente inesperada dentro de nuestros sistemas interconectados. Esto se debe, en particular, a nuestros complejos y estratificados ecosistemas digitales.

 

Lo que realmente importa, entonces, es que estés preparado y seas lo suficientemente resiliente para enfrentar lo inesperado cuando inevitablemente ocurra. Eso te permitirá abordar los problemas rápidamente y minimizar el impacto en tu organización.

 

Como lo vemos en Thoughtworks, hay dos formas importantes de lograrlo:

 

  • Comprender y modelar adecuadamente tus activos digitales para lograr una visibilidad integral del sistema.
 
  • Usar este conocimiento para implementar controles tecnológicos y prácticas que minimicen el riesgo.

 

Así es como podemos avanzar hacia la resiliencia digital. Si bien los pasos tradicionales de recuperación ante desastres y continuidad del negocio —como los procesos manuales de respaldo— son piezas importantes del rompecabezas, en una era de sistemas altamente distribuidos y dependencias complejas, los líderes deben reconocer que se requiere un enfoque más sofisticado.

Jim Gumbley, Thoughtworks
Piensa en la resiliencia digital como en la seguridad contra incendios: no es suficiente con preocuparse solo por prevenir incendios; también necesitas estar preparado para manejar los incidentes de manera efectiva cuando surjan.
Jim Gumbley
Principal Consultant, Cybersecurity
Piensa en la resiliencia digital como en la seguridad contra incendios: no es suficiente con preocuparse solo por prevenir incendios; también necesitas estar preparado para manejar los incidentes de manera efectiva cuando surjan.
Jim Gumbley
Principal Consultant, Cybersecurity

La importancia de la conciencia sobre los activos

 

La conciencia sobre los activos consiste en desarrollar una comprensión más completa de todos los componentes en tu ecosistema digital: usuarios, dispositivos, dependencias de terceros, proveedores y, crucialmente, servicios y datos. Requiere modelar cómo interactúan estos elementos para considerar la salud del sistema de manera integral.

 

Desarrollar esta comprensión exhaustiva requiere navegar los detalles específicos de tu propio contexto. Los marcos y directrices pueden ser muy valiosos — la función 'Identify' del NIST Cybersecurity Framework (CSF) debería ser una lectura esencial — pero el verdadero trabajo comienza cuando empiezas a reflexionar e interrogar lo que es único para ti. Esto se debe a que la resiliencia siempre es una cuestión de compensaciones: no puedes hacer todo.

 

El primer paso esencial es identificar los niveles de criticidad dentro de tu entorno y ecosistema más amplio. En lugar de gastar tiempo y dinero tratando de mejorar en todas partes, inviertes para mejorar la resiliencia donde realmente importa. Este enfoque previene la sobreinversión en áreas menos críticas, permitiéndote enfocar los recursos de manera efectiva. Al priorizar la criticidad y el impacto en el negocio, puedes tomar decisiones más informadas sobre dónde aplicar tus esfuerzos de resiliencia, equilibrando la mitigación de riesgos con la asignación de recursos.

 

Esto no es algo que simplemente sucede. Estas cosas deben ser priorizadas y cultivadas. Las organizaciones que capacitan a los individuos con los recursos que necesitan para aprender y adaptarse a un entorno tecnológico en rápida evolución son, invariablemente, más resilientes. Los equipos que asumen y apoyan los resultados comerciales y no simplemente administran y mantienen sistemas crean una mayor responsabilidad y mejores resultados empresariales.

Prácticas de ingeniería informadas por la conciencia sobre los activos

 

Tomar inventario de tu ecosistema digital es solo el primer paso. Debe llevar a prácticas que garanticen calidad y fiabilidad en tu software y sistemas. Aunque ninguna práctica única puede prevenir incidentes como CrowdStrike, hacer bien los fundamentos te posiciona para enfrentar lo inesperado.

 

Piensa en la resiliencia digital como en la seguridad contra incendios: no es suficiente con preocuparse solo por prevenir incendios; también necesitas estar preparado para manejar los incidentes de manera efectiva cuando surjan. Esto incluye:

 

  • Asegurar que tu código sea robusto utilizando desarrollo guiado por pruebas y integración continua.
 
  • Abordar las preocupaciones de seguridad desde el principio integrando prácticas y herramientas de seguridad directamente en el proceso de desarrollo.
 
  • Reducir errores y aumentar la consistencia mediante infraestructura como código y automatización de pruebas.
 
  • Permitir respuestas rápidas a problemas con pipelines de despliegue automatizados y lanzamientos de software pequeños y frecuentes.
 
  • Mejorar la transparencia y la visibilidad del sistema a través de una supervisión y observabilidad completas.
 
  • Mejorar la preparación para la respuesta mediante ejercicios regulares de simulación.

 

Más allá de la tecnología, la resiliencia requiere aprendizaje y desarrollo de habilidades, equipos multifuncionales y mecanismos de colaboración efectivos. Estas prácticas, aplicadas de manera consistente, crean una base para soportar y recuperarse de las interrupciones digitales.

 

Buenas prácticas de ingeniería y conciencia sobre los activos van de la mano. La conciencia sobre los activos proporciona la conciencia situacional desde la cual los equipos pueden actuar, mientras que las prácticas predeterminadas sensatas aseguran que esta comprensión se traduzca en una ejecución efectiva.

 

Un momento para reflexionar — y luego actuar

 

CrowdStrike es un gran choque: pero también es una oportunidad para que los líderes empresariales y tecnológicos evalúen dónde están ahora y si están preparados para el futuro. Es el momento de considerar cuánto conoces realmente sobre tus sistemas, infraestructura y aplicaciones; también vale la pena reflexionar sobre las capacidades y la confianza de tus equipos en las prácticas modernas de ingeniería de software.

 

Es cierto que un evento exactamente como CrowdStrike puede no volver a ocurrir. Pero algo igualmente disruptivo casi seguramente sucederá — no solo es imposible predecir qué será, sino también cuál será el impacto. Por eso es importante tomar hoy los pasos necesarios hacia la resiliencia digital.

Aviso legal: Las declaraciones y opiniones expresadas en este artículo son las del autor/a o autores y no reflejan necesariamente las posiciones de Thoughtworks.

Ayudamos a las organizaciones a desarrollar resiliencia a través de la modernización