El control sobre la infraestructura digital crítica está cada vez más en manos de un pequeño número de proveedores importantes. Si bien una nube pública proporciona un entorno de TI flexible, estable y distribuido, existen preocupaciones crecientes en torno a su capacidad de recuperación operativa.

¿Demasiado grande para confiar?

Tras algunas fallas recientes de alto perfil en la nube , y con los reguladores haciendo cada vez más preguntas, existe una creciente ansiedad de que el uso de un gran proveedor de la nube puede ser un punto único de falla, no solo técnicamente sino también desde una perspectiva de riesgo comercial.

Uptime figure.png
– Uptime Institute

Muchas organizaciones y reguladores están en desacuerdo con la falta de transparencia de los proveedores de la nube y la falta de control (consulte la Figura 1 ) que tienen los clientes importantes, algunos de los cuales son parte de la infraestructura crítica nacional. El riesgo de concentración, donde los servicios clave dependen de uno o unos pocos proveedores clave, es una preocupación particular.

Sin embargo, debido a que la variedad, el alcance de los servicios, las herramientas de administración y los entornos de desarrollo varían entre los principales proveedores de la nube, las organizaciones a menudo se ven obligadas a elegir un solo proveedor (al menos, para cada función comercial). Incluso en sectores críticos y altamente regulados, como los servicios financieros, una estrategia multinube a menudo no es factible ni es fácil cambiar de proveedor, sea cual sea el motivo.

En 2021, por ejemplo, dos importantes firmas financieras estadounidenses, Bank of America y Morgan Stanley, anunciaron que se estandarizarían en un proveedor principal de nube pública (IBM y Microsoft Azure, respectivamente). Repartir las cargas de trabajo en varias nubes que usan diferentes tecnologías y volver a capacitar a los desarrolladores o contratar a una variedad de especialistas resultó ser demasiado complejo y costoso.

Los grandes proveedores de la nube dicen que ejecutar cargas de trabajo solo en su entorno no genera una dependencia excesiva. Por ejemplo, la diversificación dentro de una sola nube puede mitigar el riesgo, como la implementación de cargas de trabajo utilizando la plataforma como servicio (PaaS) y el uso de una configuración de infraestructura como servicio (IaaS) para la recuperación ante desastres. Los proveedores también señalan la naturaleza distribuida de la computación en la nube que, combinada con un buen monitoreo y recuperación automatizada, la hace altamente confiable.

Confiabilidad no es resiliencia

Sin embargo, la confiabilidad y la resiliencia son dos cosas diferentes. Una alta confiabilidad sugiere que habrá pocas interrupciones y un tiempo de inactividad limitado, mientras que una alta resiliencia significa que un sistema no solo tiene menos probabilidades de fallar, sino que él y otros sistemas que dependen de él pueden recuperarse rápidamente cuando hay una falla. Mientras que en los centros de datos empresariales y de colocación, y en la TI corporativa, los diseños se pueden analizar, eliminar los puntos únicos de falla y ensayar los procesos para fallas del sistema, en los servicios en la nube es en su mayoría (o en parte) una caja negra. Estos procesos los lleva a cabo el proveedor de la nube, entre bastidores y en beneficio de todos sus clientes, y no para garantizar los mejores resultados solo para unos pocos.

Nuestra investigación muestra que los proveedores de la nube tienen altos niveles de confiabilidad, pero no son inmunes a fallas. Los regímenes de copia de seguridad complejos y las zonas de disponibilidad, compatibles con la gestión de la carga y el tráfico, mejoran la resiliencia y la capacidad de respuesta de los proveedores de la nube, pero también presentan sus propios problemas. Cuando ocurren problemas, muchos clientes a menudo se ven afectados de inmediato y la recuperación puede ser compleja. En 2020, Uptime Institute registró 21 interrupciones de la nube/gigantes de Internet que tuvieron importantes consecuencias financieras o negativas de otro tipo (consulte el Análisis anual de interrupciones de 2021 ).

Consciente de estos riesgos, el gigante financiero estadounidense JPMorgan, por ejemplo, es uno de los pocos en su sector que adopta un enfoque multinube. Los gerentes de JPMorgan han citado preocupaciones sobre la falta de control con un solo proveedor y, en el caso de una interrupción importante, la complejidad y el tiempo necesario para migrar a otro proveedor y volver a arrancar.

Los reguladores también están preocupados, especialmente en la industria de servicios financieros, donde las nuevas reglas obligan a los bancos a realizar la debida diligencia con los proveedores de la nube. En el Reino Unido, el Banco de Inglaterra está introduciendo nuevas reglas para garantizar una mejor supervisión de la gestión sobre la dependencia de la nube de los grandes bancos. Y la Autoridad Bancaria Europea ordena que un operador de la nube (u otro tercero) permita las inspecciones en los centros de datos.

Una nueva ley de la UE propuesta tiene implicaciones más amplias: la Ley de resiliencia operativa digital (DORA) pone a los proveedores de la nube bajo el control de los reguladores financieros por primera vez. Se espera que pase en 2022, los proveedores de la nube, entre otros proveedores, podrían enfrentar grandes multas si la pérdida de sus servicios causa una interrupción en la industria de servicios financieros. Los gobiernos europeos también han expresado su preocupación política por la creciente dependencia de proveedores no europeos.

En 2022, esperamos que estas preocupaciones sobre el "riesgo de concentración" surjan en las agendas de más gerentes. Con anticipación, algunos proveedores de servicios planean enfocarse más en habilitar configuraciones de múltiples nubes.

Sin embargo, el riesgo de concentración va más allá de la computación en la nube. Se ha demostrado que los problemas en uno o más grandes proveedores causan problemas técnicos para servicios completamente no relacionados. En 2021, por ejemplo, un problema técnico en el proveedor de la red de distribución de contenido (CDN) Fastly provocó una interrupción global de Internet; mientras que una interrupción en el proveedor de CDN Akamai eliminó el acceso a los servicios en la nube de AWS e IBM (así como a los servicios en línea para muchos bancos y otras empresas). Cada incidente apunta a un problema más amplio: la concentración del control sobre los servicios básicos de infraestructura de Internet en relativamente pocos proveedores importantes.

¿Cómo se desarrollarán estas preocupaciones? Algunos grandes clientes exigen una mejor visión de la infraestructura de los proveedores de la nube y una mejor comprensión de las posibles vulnerabilidades. Como muestra nuestra investigación, más administradores de centros de datos y TI considerarían trasladar más cargas de trabajo de misión crítica a nubes públicas si mejora la visibilidad de la resiliencia operativa del servicio.

Si bien los centros de datos de la nube pública pueden tener perfiles de riesgo adecuados para la mayoría de las cargas de trabajo empresariales de misión crítica, los detalles sobre la infraestructura y sus riesgos serán cada vez más inadecuados para los reguladores o auditores. Y es probable que la legislación, como la DORA propuesta, con sanciones por interrupciones que van mucho más allá de los acuerdos de nivel de servicio, genere una mayor atención regulatoria en más regiones y en más sectores de misión crítica.


Por Rhonda Ascierto, vicepresidenta de investigación en Uptime Institute