En los últimos tiempos hemos hecho referencia varias veces al tema de la eficiencia energética en los data center y, en particular, al concepto PUE enmarcándolo en el análisis más general de la eficiencia dentro de un entorno de estas características.
Como debería ser ya de sobra conocido, PUE es sólo un término que expresa la eficiencia de la parte electromecánica para una carga IT dada pero que, en ningún caso, representa la eficiencia del centro. De hecho, al comparar dos data centers, no necesariamente el que presenta un nivel PUE más reducido es el de mayor eficiencia, ocurriendo demasiadas veces exactamente lo contrario.
Para encontrar parámetros más conectados con la eficiencia real de un centro deberíamos analizar la cantidad de trabajo útil que se realiza por unidad de energía incidente, algo así como el, hace tiempo sugerido, DPpE (Data Processing per Energy).
Sin embargo, existe un concepto algo más complejo, que siempre me ha gustado, especialmente desde que, por primera vez allá por 2007, se lo oí postular a mi admirado Ken Brill, fundador de Uptime Institute. Se trata de CADE (Corporate Average Datacenter Efficiency), cuya naturaleza era del todo apropiada para la ocasión, pero que no llegó a cuajar en el sector, quizá por la falta de precisión a la hora de poder valorar en su totalidad los componentes de la ecuación.
CADE, venía a cubrir la laguna creada por las carencias de PUE y, sobre todo, porque el sector tomó, erróneamente, a este último como una especie de santo grial. Se trata del producto de cuatro factores. Dos de ellos correspondientes a la parte IT, que conforman la denominada IT Asset Efficiency, y otros dos a la E&M, constituyendo la Facility Efficiency, y considerando en cada uno de esos terrenos tanto el rendimiento de los equipos como el nivel de utilización de éstos.
En lo que respecta a la parte IT, mayor contribuyente sin duda a la eficiencia global, y sobre la que daremos algo más de detalle en otra ocasión, los dos puntos de vista, aunque de complicada ponderación, se encuentran bien definidos desde origen y los conceptos asociados han derivado en lo que hoy se conocen como ITEE e ITEU, respectivamente, en la norma ISO 30134.
Pero es a la parte E&M a la que quiero dedicar un poco más de atención. Los dos escenarios que se plantean a la hora de considerar la Facility Efficiency real en esa área, son manejados de forma muy dispar. Por un lado, se encuentra todo lo relativo al rendimiento de los componentes del sistema, lo que determina un factor muy similar a PUE y, en concreto, a su inversa DCiE (Data Center Infrastructure Efficiency), algo ya asumido desde hace años por el sector y que se maneja con soltura, a veces yo diría que con demasiada soltura.
Y es con el cuarto factor de CADE, con el que quiero extenderme un poco en las siguientes líneas. Partiendo de otra de las frases más conocidas de Ken Brill como era “el data center más eficiente es aquel que no se construye” en clara referencia a la necesidad de priorizar el aprovechamiento máximo de los recursos existentes, la entrada en la ecuación de CADE de un factor que tenga en cuenta, precisamente, la correspondencia entre la potencia instalada en los componentes del suministro y la potencia IT de diseño, era algo primordial.
La idea es sencilla, es decir, conocer cuanto representa la potencia IT de diseño respecto de la potencia instalada para hacer posible su funcionamiento o viceversa. Se trata, por tanto, de tener una visión clara sobre el nivel de redundancia existente y sobre el excedente de kW que tanta relación tiene con el Capex y, cómo no, también con el Opex.
El concepto, como tal, soy consciente de que se está utilizando ampliamente en el sector, pero no conozco un término común para él, o un acrónimo que lo represente, por lo que, ya desde hace un tiempo, en PQC hemos dado en llamar a ese término como Power in Excess o PIE. Y lo manejamos como dato básico para cualquier proyecto, como complemento de la topología de diseño, certificable o no, y del nivel de PUE propuesto. O sea, PIE y PUE.
Para el dimensionamiento de la potencia de suministro en un data center hemos de tener en cuenta, en primer lugar, la carga IT que debería ser la principal (si no es así, hay que hacérselo mirar, ya que el dimensionamiento del cooling se ha ido por las nubes). En segundo lugar, hay que incorporar la propia instalación de clima y su demanda ante el peor escenario. En tercero, la sucesión de distintas pérdidas que se dan en la infraestructura, cargas de baterías y otros factores externos como comunicaciones, operadores, etc. Con todo ello, el factor de dimensionamiento mínimo que puede estimarse para una instalación donde, en algún momento, debe entrar la refrigeración mecánica, no baja habitualmente de 1,7 (debemos hacer aquí una salvedad para aquellas instalaciones que tienen la suerte de poder disponer de freecooling durante todo el tiempo, con lo que no hay que disponer de alimentación para la producción de frío y el valor PIE puede ser, por ello, más reducido).
A ello, hay que sobreponer los niveles de redundancia propios de la topología seleccionada, llegando al final a una cifra de PIE que va a ser un claro indicativo del objetivo de diseño.
PIE puede estar referido a consideraciones más generales del centro o descender a terrenos más particulares. Así, si queremos evaluar el exceso general de potencia instalada, analizaremos el cociente entre la potencia total de transformadores y grupos (PIEt y PIEg), mientras que, si lo que queremos examinar es el dimensionamiento de la potencia frigorífica, tendríamos PIEF y la de alimentación ininterrumpida PIEU, teniendo como denominador, en todos los casos, la carga IT de diseño (en la parte de clima, la carga térmica es algo superior a la potencia TI pero tomamos ésta como referencia por uniformidad con los demás valores PIE)
La PIE (que también es en femenino como la PUE) ha ido evolucionando a la baja en los últimos años. Así, en proyectos de hace más de 10 años, donde las topologías más habituales presentaban soluciones 2xN con algún elemento extra de respaldo incluido, no era difícil observar cómo se alcanzaban valores de PIEg de 6 o 7.
Los tiempos han ido cambiando y, una de las constantes más observadas últimamente es la de una permanente búsqueda de diseños donde se optimice la inversión y donde, a pesar de mantenerse las exigencias de topología, se consiga mediante la utilización de un menor número de componentes. Por ello, en los proyectos planteados en sucesivas fases de ejecución, cada día es más normal observar cómo los diseños van a soluciones de respaldo comunes para distintas fases.
Como ya hemos comentado, el valor PIE tiene su expresión más general cuando lo referimos a los grupos electrógenos, por lo que las clásicas soluciones a base de un conjunto único de grupos en paralelo presentan valores muy razonables. Asimismo, la utilización de bloques comunes de respaldo en la alimentación también presenta niveles PIEg muy interesantes.
Para ambos casos, las teóricas limitaciones de ese tipo de soluciones a la hora de llegar a topologías Tier IV ha quedado salvadas hace tiempo, por lo que, incluso en esos casos de máxima exigencia, cuanto mayor el número de componentes en paralelo o el número de fases respaldadas por el mismo soporte, menor el valor PIEg. Hoy en día estamos manejando niveles entre 2.1 y 2.4 y la misma consideración que damos a los grupos la debemos hacer con los transformadores.
Sin embargo, para formas más específicas de PIE, tendríamos las siguientes consideraciones.
En la parte de UPSs, la extendida costumbre de disponer de dos ramas independientes lleva a PIEU a valores siempre superiores a 2, que en la época de dimensionamientos 2x(N+1) alcanzaba valores superiores incluso a 3 (hemos conocido proyectos dotados de UPSs en 2x(N+2) con PIE=3,75)
El valor PIEU para UPSs se puede mejorar acudiendo a topologías multibus (1,5 como límite para el tribus, 1,33 para el tetrabus y así sucesivamente), no siendo conveniente bajar de 1,25 cuando se trata de topologías con UPSs de respaldo común.
En cuanto a la potencia frigorífica se refiere, la historia más reciente nos ha deparado claros ejemplos de sobredimensionamientos donde PIEf >3, mientras que la realidad actual nos presenta soluciones muy al límite de redundancia con valores PIEf <1,10
Por otra parte, es importante precisar que los valores descritos anteriormente son en referencia a la potencia IT de diseño y ésta rara vez se alcanza en proyectos al uso, es más, en demasiadas ocasiones no se alcanza ni la mitad, por lo que, para esos casos, cuando los dimensionamientos no son escalables, o no mucho, la cifra asignada a PIE se resiente enormemente, obviamente al alza.
Así, para casos de carga parcial, es decir, para la práctica totalidad de los casos reales, el subíndice del valor PIE podría expresarse en minúsculas (PIEg, PIEt, PIEf, PIEu, etc.) y, si es posible y de la misma manera que con PUE, para prevenir indeseables infartos nunca realizar la medición por debajo del 25% de carga, aunque, por otro lado, deberemos tratar de hacer diseños lo suficientemente escalables como para que la instalación no tenga que permanecer mucho tiempo con bajos estados de carga.
En definitiva, para tener una visión más real de la eficiencia de la parte electromecánica en un data center, seguiremos, como hasta ahora, examinando de cerca las variaciones de PUE, pero los excesos de dimensionamiento que cada vez tienen menos influencia en PUE (el uso de variadores a carga muy parcial mejora las cifras generales cuando existe un mayor número de máquinas) nos llevan a un escenario donde cada vez va siendo más imprescindible introducir en sociedad a un concepto que tenga que ver con la energía contenida y con la inversión de capital, llamémosle PIE o como se quiera.
¡Ahí va el reto!