Hace cuatro años, en Aeon Ingeniería realizábamos un primer informe sobre el estado de la operación y mantenimiento en los centros de datos. En el presente informe describimos cómo han evolucionado en estos últimos años.
Tradicionalmente, se entendía por Operación y Mantenimiento de centros de datos, los procesos asociados a la infraestructura (Facilities), no a la Operación y Mantenimiento de la Infraestructura de las Tecnologías de la Información y Comunicaciones (TIC) si bien, ya apuntábamos en el informe anterior que empezaríamos a hablar de verdadera madurez del sector, cuando esta diferenciación dejase de producirse.
Nos aventurábamos a decir entonces que esta línea se difuminaría completamente en los próximos años porque no sería posible obtener dichas disponibilidades ni, sobre todo, las eficiencias deseadas sin que ambos mundos sean el mismo.
Veamos cómo es la situación actual.
Requerimientos Datacenter 2020: disponibilidad, eficiencia y seguridad
Siempre hemos dicho que los dos requerimientos más importantes en el diseño de un centro de datos eran la disponibilidad y la eficiencia, fundamentalmente porque eran elementos certificables, de lo que hablaremos más adelante. Pues bien, en los últimos tiempos emerge un requerimiento que empieza a tener características propias, como es la seguridad.
La seguridad, referida desde el punto de vista de la infraestructura física del centro de datos, no nos referimos a la seguridad lógica, la podemos abarcar desde tres vertientes:
- La seguridad física de la infraestructura (intrusión).
- La seguridad de las comunicaciones/cableado (qué activos tenemos y dónde se conectan).
- La securización de las redes de monitorización y gestión.
Operación y Mantenimiento 2020
1.- EL QUÉ: instalaciones, IT y comunicaciones
Si queremos cumplir los tres objetivos anteriores que nos hemos marcado (disponibilidad, eficiencia y seguridad), la gestión de las instalaciones es clave.
La gestión de la infraestructura IT impacta directamente en la disponibilidad y en la seguridad, pero especialmente en la eficiencia. Llevamos años hablando de PUE (carga total DC/carga TI), pero parece que el denominador “no tiene quien le escriba”, nadie se ocupa de él, siendo el más importante en cuanto a eficiencia. Y efectivamente, se pueden hacer muchas cosas para mejorar ese consumo.
Es en este punto donde ha venido nuestro apoyo a la certificación CEEDA, que nos pide evidencias de que sí nos estamos ocupando de este consumo.
Por último, tenemos la gestión de las comunicaciones, muchas veces descuidadas en los proyectos de centro de datos, pero claves en la operación del centro de datos. Además de las tres vertientes de seguridad antes citadas, su papel en el requerimiento de disponibilidad es evidente. No olvidemos que el nivel de complejidad del cableado, tanto a nivel de instalación, como a nivel de operación está en los Niveles 2 y 3, con las implicaciones que ello lleva en el sistema de administración y gestión.
Aeon Ingeniería lleva años definiendo sus proyectos con el foco en la operación.
2.- EL CÓMO: Metodología y Comportamiento
Una operación y un mantenimiento (O&M) bien hechos no se miden en “no haber tenido un cero en los últimos años.” Eso sería en todo caso, la consecuencia (alguna vez lo hemos explicado como la diferencia entre KPI y KBI).
Una O&M bien hechos se basan en METODOLOGÍA y COMPORTAMIENTO.
La metodología se refiere a la gestión y al procedimiento de los recursos y procesos implicados, que en nuestro caso son desde los recursos humanos específicos, la infraestructura y sus riesgos, la gestión de cambios, la gestión de incidencias, hasta la gestión del conocimiento.
3.- DCIM
Para manejar estos elementos y cumplir los procesos de gestión, se hacen necesarias herramientas con capacidad de gestionar los tres elementos citados: infraestructuras, IT y comunicaciones. Hoy podemos afirmar que esto es un mínimo.
No pensemos en el DCIM como la panacea para resolver los problemas de operación, pero es una herramienta totalmente eficaz y necesaria.
En el reciente DCD Virtual 2020, expusimos el caso de éxito de la SGAD (Secretaría General de Administración Digital) de implementación de la herramienta DCIM como modelo de operación. https://www.datacenterdynamics.com/es/eventos/espana/2020-virtual/programa-virtual/
4.- Certificación y Formación
Certificar la operación es una de las mejores prácticas que podemos abordar. Diría incluso que, aunque nos muestre y demuestre “lo malos que podríamos ser” sería una buena práctica y nos permitiría saber dónde estamos.
En la actualidad, podemos encontrar tres certificaciones relacionadas de una u otra forma con la operación:
- Uptime Institute - Certificación en Sostenibilidad Operativa.
- TÜV (EN 50600) - Especialmente en ámbitos de Documentación y Organización.
- CEEDA - Certificación de eficiencia energética.
Conclusiones
Estas tendencias ya están en proceso de ejecución en muchas compañías, las cosas están avanzado mucho.
Por nuestra experiencia, podemos concluir:
- Parece evidente que solo una O&M profesional hará que las infraestructuras de los centros de datos cumplan con los requerimientos exigidos de disponibilidad, eficiencia y seguridad.
- Es necesario que el alcance incluya instalaciones, IT y comunicaciones.
- El diseño y la ejecución de estos planes de O&M no es trivial y requiere del uso de ciertas herramientas. Es necesaria una herramienta DCIM.
Preparar y organizar estos proyectos, puede hacerlos usted solo, pero desde Aeon nos ofrecemos a acompañarle y ayudarle en el diseño de estos procesos.
Por Isidro Ramos Salgado, AEON INGENIERÍA