A principios de 2021, el Comité Técnico 9.9 de ASHRAE publicó una actualización, la quinta edición, de sus Pautas térmicas para entornos de procesamiento de datos. La actualización recomienda cambios importantes en los envolventes de funcionamiento térmico de los centros de datos: la presencia de contaminantes es ahora un factor e introduce una nueva clase de equipo de TI para la computación de alta densidad. El nuevo consejo puede, en algunos casos, llevar a los operadores no solo a alterar las prácticas operativas sino también a cambiar los puntos de ajuste, un cambio que puede afectar tanto la eficiencia energética como los acuerdos de nivel de servicio (SLA) contractuales con los proveedores de servicios del centro de datos.

Desde el lanzamiento original en 2004, las pautas térmicas de ASHRAE han sido fundamentales para establecer estándares de refrigeración para centros de datos a nivel mundial. El comité 9.9 recopila información de una amplia sección representativa de la industria de centros de datos y TI para promover un enfoque basado en la evidencia para los controles climáticos, uno que ayude a los operadores a comprender mejor tanto los riesgos como las oportunidades de optimización. Históricamente, la mayoría de los cambios en las pautas apuntaban a los operadores de centros de datos hacia una mayor relajación de los puntos de ajuste climáticos (por ejemplo, temperatura, humedad relativa, punto de rocío), lo que también estimulaba a los fabricantes de equipos a desarrollar sistemas economizadores de aire más eficientes.

En la quinta edición, ASHRAE agrega algunas advertencias importantes a su guía térmica. Si bien las recomendaciones de humedad relativa (HR) extienden el rango hasta un 70 por ciento (el límite anterior era del 60 por ciento), esto está condicionado a que la sala de datos tenga bajas concentraciones de gases contaminantes. Si la presencia de gases corrosivos está por encima de los umbrales establecidos, ASHRAE ahora recomienda que los operadores mantengan la HR por debajo del 50 por ciento, por debajo del límite recomendado anteriormente. Para monitorear, los operadores deben colocar tiras de metal, conocidas como “cupones de reactividad”, en la sala de datos y medir la formación de capas corroídas; el límite para la plata es 200 ångström por mes y para el cobre, 300 ångström por mes.

ASHRAE basa su orientación mejorada en un estudio experimental sobre los efectos de los contaminantes gaseosos y la humedad en la electrónica, realizado entre 2015 y 2018 con investigadores de la Universidad de Syracuse (EE. UU.). Los experimentos encontraron que la presencia de cloro y sulfuro de hidrógeno acelera la corrosión del cobre en condiciones de mayor humedad. Sin cloro, sulfuro de hidrógeno o catalizadores igualmente fuertes, no hubo corrosión significativa hasta el 70 por ciento de HR, incluso cuando estaban presentes otros contaminantes gaseosos menos agresivos (como ozono, dióxido de nitrógeno y dióxido de azufre).

Debido a que la corrosión por cloro y sulfuro de hidrógeno al 50 por ciento de HR aún está por encima de los niveles aceptables, ASHRAE sugiere que los operadores consideren la filtración química para descontaminar.

Si bien los datos que usa ASHRAE son relativamente nuevos, sus conclusiones se hacen eco de estándares anteriores. Aquellos familiarizados con los requisitos ambientales de los sistemas de almacenamiento de datos pueden encontrar la guía familiar: los proveedores de almacenamiento de datos han estado siguiendo las especificaciones establecidas en ANSI / ISA-71.04 desde 1985 (última actualización en 2013). Mucho después de la era de las cintas, las unidades de almacenamiento (tanto de disco duro como de estado sólido) siguen siendo las principales víctimas de la corrosión, ya que sus requisitos operativos a baja temperatura significan una mayor absorción y adsorción de humedad.

Sin embargo, muchos operadores de centros de datos no miden habitualmente los niveles de contaminantes gaseosos y, por lo tanto, no controlan la corrosión. Si los catalizadores fuertes están presentes pero no se detectan, podría conducir a tasas de falla más altas de lo esperado incluso si la temperatura y la HR están dentro de los rangos objetivo. Peor aún, reducir la temperatura del aire de suministro en un intento de contrarrestar las fallas podría aumentar las probabilidades de que se produzcan. ASHRAE recomienda que los operadores consideren un límite de humedad relativa del 50 por ciento si no realizan mediciones de cupón de reactividad. De manera algo confusa, también tiene en cuenta las siguientes especificaciones establecidas en su actualización anterior (la cuarta edición), que recomienda un límite de humedad relativa del 60 por ciento.

Envolvente restringida para sistemas informáticos de alta densidad

Otro cambio importante en la última actualización es la adición de una nueva clase de equipo de TI, separada de las clases preexistentes de A1 a A4. La nueva clase, H1, incluye sistemas que integran estrechamente una serie de componentes de alta potencia (procesadores de servidor, aceleradores, chips de memoria y controladores de red). ASHRAE dice que estos sistemas de alta densidad necesitan bandas de temperatura del aire más estrechas: recomienda 18 ° C / 64,4 ° F a 22 ° C / 71,6 ° F (en lugar de 18 ° C / 64,4 ° F a 27 ° C / 80,6 ° F ) - para cumplir con sus requisitos de refrigeración. La envolvente permitida también se ha vuelto más ajustada, con límites superiores de 25 ° C / 77 ° F para la clase H1, en lugar de 32 ° C / 89,6 ° F (consulte la Figura 1).

uptime_TC99.original.png
Figura 1. Sobres recomendados y permitidos para 2021 para ASHRAE Clase H1. El sobre recomendado es para niveles bajos de contaminantes verificados por medidas de cupones. – ASHRAE

Esto se debe a que, según ASHRAE, simplemente no hay espacio suficiente en algunos sistemas densos para los disipadores de calor y ventiladores de mayor rendimiento que podrían mantener los componentes por debajo de los límites de temperatura en el sobre recomendado genérico (clases A1 a A4). ASHRAE no estipula qué hace que un sistema sea de clase H1, dejando que el proveedor de TI especifique sus productos como tales.

Hay algunas implicaciones potencialmente de gran alcance de estos nuevos envoltorios. Durante la última década, los operadores han construido y equipado una gran cantidad de instalaciones según la guía anterior de ASHRAE. Muchos de estos centros de datos relativamente nuevos aprovechan las bandas de temperatura recomendadas utilizando menos refrigeración mecánica y más economización. En varias ubicaciones, Dublín, Londres y Seattle, por ejemplo, incluso es posible que los operadores eliminen por completo el enfriamiento mecánico y se mantengan dentro de las pautas de ASHRAE al combinar el uso de controladores de aire evaporativos y adiabáticos con un diseño avanzado de flujo de aire y disciplina operativa. El resultado es un gran salto en la eficiencia energética y la capacidad de soportar más carga de TI desde una subestación.

Normalmente, estas instalaciones optimizadas no se adaptarán bien a los nuevos sobres. El hecho de que la mayoría de estos centros de datos puedan admitir racks de TI de 15 a 20 kilovatios tampoco ayuda, ya que H1 es una nueva clase de equipo que requiere una temperatura máxima más baja, independientemente de la densidad del rack. Para mantener la eficiencia energética de los nuevos diseños de centros de datos altamente optimizados, la TI densa puede necesitar tener su propia área dedicada con enfriamiento independiente. De hecho, ASHRAE dice que los operadores deben separar H1 y otros equipos más restringidos en áreas con sus propios controles y equipos de enfriamiento.

Uptime observará con interés cómo los proveedores de colocación, en particular, manejarán este desafío, ya que sus SLA típicos dependen en gran medida de las pautas térmicas de ASHRAE. Lo que hoy en día puede considerarse una rareza, pronto se volverá común, dado que la potencia de los semiconductores sigue aumentando con cada generación. Los operadores de instalaciones pueden implementar refrigeración líquida directa para TI de alta densidad como una forma de salir de este problema.


Por Daniel Bizo, director de investigación del Uptime Institute