Un cambio potencial en la naturaleza de las cargas de trabajo se filtrará a la industria de centros de datos, lo que afectará la forma en que se construyen y dónde se ubican.

Centros de datos más grandes, racks más calientes

El CEO de Digital Realty, Andy Power, cree que la IA generativa conducirá a “una ola monumental de demanda.

“Todavía es nuevo en cuanto a cómo se desarrolla en la industria del centro de datos, pero definitivamente será una demanda a gran escala. Simplemente haga los cálculos con estas cotizaciones de gasto y chips A100 y piense en los gigavatios de energía necesarios para ellos”.

Cuando se unió a la empresa hace casi ocho años, “pasábamos de suites de TI de uno a tres megavatios, y rápidamente pasamos a seis a ocho, luego a decenas”, recordó. “Creo que el edificio más grande que construimos fue de 100MW durante varios años. Y los acuerdos más importantes que firmamos fueron del tipo de 50MW. Ahora se están firmando ofertas de cientos de megavatios, y he tenido conversaciones preliminares en los últimos meses en las que los clientes piden información sobre un gigavatio'".

Para entrenar modelos de IA, Power cree que veremos un cambio del enfoque de nube tradicional que se enfoca en dividir las cargas de trabajo en múltiples regiones mientras se mantiene cerca del usuario final.

“Dada la intensidad de la computación, no puede simplemente dividirlos y distribuirlos en parches en muchas geografías o ciudades”, dijo. Al mismo tiempo, "no vas a poner esto en medio de la nada, debido a la infraestructura y el intercambio de datos".

Estas instalaciones aún necesitarán estar muy cerca de otros centros de datos con datos y cargas de trabajo más tradicionales, pero "la proximidad y qué tan cerca debe estar la carga de trabajo de IA en relación con la nube y los datos aún se desconoce".

Él cree que "todavía estará muy centrado en el área metropolitana", lo que resultará un desafío porque "va a necesitar grandes franjas de tierra y energía contiguas, pero cada vez es más difícil encontrar un gigavatio de energía contiguo", dijo, señalando los desafíos de transmisión en Virginia y en otros lugares.

En cuanto a los centros de datos en sí mismos, "simple y llanamente, va a ser un entorno más cálido, solo va a instalar muchos más servidores densos en energía y necesitará innovar sus huellas existentes y su diseño para nuevas huellas ", dijo.

“Hemos estado innovando para nuestros clientes empresariales en cuanto a la refrigeración líquida.”, dijo. “También hemos estado haciendo co-diseño con nuestros clientes de hiperescala, pero esas han sido excepciones, no las normas.”

Edificios especializados

En el futuro, cree que “habrá dos edificios que estarán uno al lado del otro y uno admitirá la nube híbrida. Y luego tienes otro al lado que es el doble o el triple del tamaño, con un diseño diferente, una infraestructura de enfriamiento diferente y una densidad de potencia diferente”.

Amazon está de acuerdo en que los grandes modelos de IA necesitarán instalaciones especializadas. “La capacitación debe agruparse, y es necesario tener grupos muy, muy grandes y profundos de una capacidad particular”, dijo Chetan Kapoor de AWS.

“La estrategia que hemos estado ejecutando durante los últimos años, y que vamos a duplicar, es que vamos a elegir algunos centros de datos que estén vinculados a nuestras regiones principales, como el norte de Virginia (EE. UU. Este-1) u Oregón (EE. No solo con el cómputo sin procesar, sino también combinándolo con bastidores de almacenamiento para admitir sistemas de archivos de alta velocidad”.

Por el lado de la capacitación, la empresa tendrá implementaciones de clústeres especializados. “Y se puede imaginar que vamos a enjuagar y repetir en las GPU y Trainium”, dijo Kapoor. “Así que habrá centros de datos dedicados para las GPU H100. Y habrá centros de datos dedicados para Trainium”.

Serán diferentes en el lado de la inferencia, donde estará más cerca del modelo de nube tradicional. “Las solicitudes que estamos viendo son que los clientes necesitan múltiples zonas de disponibilidad, necesitan soporte en múltiples regiones. Ahí es donde realmente brilla parte de nuestra capacidad central en torno a la escala y la infraestructura para AWS. Muchas de estas aplicaciones tienden a ser de naturaleza en tiempo real, por lo que tener la computación lo más cerca posible del usuario se vuelve muy, muy importante”.

Sin embargo, la compañía no planea seguir el mismo enfoque de rack de servidor denso de sus competidores en la nube.

“En lugar de empaquetar una gran cantidad de cómputo en un solo rack, lo que estamos tratando de hacer es construir una infraestructura que sea escalable e implementable en múltiples regiones, y que sea lo más eficiente posible en términos de energía”, dijo Kapoor. "Si está tratando de empaquetar densamente muchos de estos servidores, el costo aumentará, porque tendrá que encontrar soluciones realmente costosas para enfriarlo".

Vahdat de Google estuvo de acuerdo en que veremos grupos específicos para la capacitación a gran escala, pero señaló que, a largo plazo, es posible que no esté tan segmentado. “La pregunta interesante aquí es, ¿qué sucede en un mundo en el que vas a querer refinar gradualmente tus modelos? Creo que la línea entre entrenar y servir se volverá un poco más borrosa que la forma en que hacemos las cosas en este momento”.

Comparándolo con los primeros días de Internet, donde la indexación de búsquedas estaba a cargo de unos pocos centros de cómputo alto, pero ahora está repartida por todo el mundo, señaló: “Desdibujamos la línea entre la capacitación y el servicio.”

Dónde y cómo construir

Si bien esta nueva ola de carga de trabajo corre el riesgo de dejar a algunas empresas a su paso, el director ejecutivo de Digital Realty ve este momento como una "marea creciente para levantar todos los barcos, llegando como una tercera ola cuando la segunda y la primera aún no han llegado a la orilla".

Las dos primeras oleadas fueron clientes que pasaron de las instalaciones a la colocación, y luego a los servicios en la nube entregados desde implementaciones mayoristas de hiperescala.

Esa es una gran noticia para la industria, pero llega después de años en los que el sector lucha por mantenerse al día. “La demanda sigue superando a la oferta, [la industria] está tosiendo de rodillas porque no tiene gasolina”, dijo Power. “La tercera ola de demanda no llega en un momento fortuito para que sea un camino fácil para el crecimiento”.

A pesar de todas sus esperanzas de resolver o trascender los desafíos actuales, el crecimiento de la IA generativa se verá frenado por las dificultades más amplias que han plagado el mercado de los centros de datos: los problemas de escala.

¿Cómo pueden los operadores de centros de datos desarrollar rápidamente capacidad a una escala mayor y más rápida, consumiendo más energía, tierra y agua, al mismo tiempo que utilizan recursos renovables y no provocan un aumento de las emisiones?

“Restricciones de potencia en el norte de Virginia, preocupaciones ambientales, moratorias, problemas en la cadena de suministro, escasez de trabajadores talentosos, etc.”, son algunos de los problemas externos queenumeró Power.

“Y eso sin tener en cuenta los aspectos que el cliente posee y opera. Muchas de estas cosas tienen plazos de entrega muy altos”, ya que las GPU actualmente son difíciles de adquirir incluso para los hyperscalers, lo que provoca el racionamiento."

“La economía ha estado funcionando bien durante muchos años”, dijo Power, “y llevará algún tiempo reponer gran parte de esta infraestructura, llevando líneas de transmisión a diferentes áreas. Y es un esfuerzo comunitario local, gubernamental y entrelazado masivo”.

Mientras que los investigadores de IA y los diseñadores de chips se enfrentan a los desafíos de escala del conteo de parámetros y la asignación de memoria, los constructores y operadores de centros de datos tendrán que superar sus propios cuellos de botella para satisfacer las demandas de la IA generativa.

“Seguiremos viendo hitos más grandes que requerirán que la computación no se convierta en un impedimento para el progreso de la IA y más en un acelerador”, dijo Nidhi Chappell de Microsoft. “Incluso con solo mirar la hoja de ruta en la que estoy trabajando en este momento, es increíble, la escala no tiene precedentes. Y es completamente necesario”.

Anexo: ¿Podría ser todo una exageración?

A medida que planificamos para el futuro y tratamos de extrapolar lo que la IA significa para la industria de los centros de datos y la humanidad en general, es importante dar un paso atrás en la cobertura sin aliento que pueden generar las tecnologías potencialmente transformadoras.

Después del auge del silicio, el nacimiento de Internet, la revolución de los teléfonos inteligentes y las aplicaciones, y la proliferación de la nube, la innovación se ha estancado. El silicio se ha vuelto más poderoso, pero a un ritmo cada vez más lento. Los negocios de Internet han madurado y se han solidificado en torno a unas pocas corporaciones gigantes. Las aplicaciones se han desplazado a algunos destinos importantes, rara vez desplazados por los recién llegados. Cada nueva generación de teléfonos inteligentes apenas se distingue de la anterior.

Pero aquellos que se han beneficiado de los auges anteriores siguen siendo paranoicos acerca de lo que podría suceder a continuación. Aquellos que se lo perdieron están igualmente buscando la próxima oportunidad. Ambos miran al pasado y a la riqueza generada por los puntos de inflexión como prueba de que la próxima ola seguirá el mismo camino. Esto ha llevado a una cultura de múltiples falsos comienzos y promesas exageradas.

El metaverso estaba destinado a ser la próxima ola de Internet. En cambio, simplemente derrumbó el precio de las acciones de Meta. La criptomoneda estaba destinada a revisar los sistemas financieros. En cambio, quemó el planeta y solidificó la riqueza en manos de unos pocos. Los NFT estaban destinados a revolucionar el arte, pero rápidamente se convirtieron en una broma. Después de años de promoción, las computadoras cuánticas comerciales siguen siendo tan intangibles como el gato de Schrödinger.

La IA generativa parece ser diferente. El ritmo de avance y los resultados finales son una clara evidencia de que hay casos de uso más tangibles. Pero es notable que los entusiastas de las criptomonedas se hayan renombrado como defensores de la IA, y las empresas de metaversos se hayan convertido en empresas generativas. Muchas de las personas que promocionan la próxima gran cosa podrían estar impulsando la próxima gran moda.

La velocidad a la que avanza una tecnología es una combinación de cuatro factores: el poder intelectual que aplicamos, las herramientas que podemos usar, la suerte y la voluntad de financiarla y apoyarla.

Hemos hablado con algunas de las mentes que exploran y expanden este espacio, y discutimos algunas de las tecnologías que impulsarán lo que viene a continuación, desde la escala de chips hasta los centros de datos y la nube.

Pero no hemos tocado las otras dos variables.

La suerte, por su naturaleza, no puede ser capturada hasta que haya pasado. Los modelos de negocio, por otro lado, suelen estar entre los temas más fáciles sobre los que obtener respuestas. No es así en este caso, ya que la tecnología y la exageración superan los intentos de construir negocios sostenibles.

Una vez más, hemos visto esto antes con la burbuja de las puntocom y cualquier otro auge tecnológico. Una gran mayoría está integrado en la mentalidad de Silicon Valley, apostando grandes sumas de dinero en cada nueva tecnología sin una estrategia de monetización clara, con la esperanza de que la escala de transformación finalmente lleve hacia una riqueza insondable.

Las tasas de interés más altas, una serie de quiebras de alto perfil y el colapso de Silicon Valley Bank han puesto a prueba esa mentalidad.

En este momento, las empresas de IA generativa están recaudando enormes sumas de dinero gracias a promesas descabelladas de riqueza en el futuro. El ritmo de la evolución dependerá de cuántos puedan escapar del pozo de gravedad de la escala y los costos operativos, para construir negocios realistas y sostenibles antes de que inevitablemente se cierren las carteras.

Y esos eventuales ganadores serán los que definan la forma final de la IA.

Todavía no sabemos cómo de costoso será entrenar modelos más grandes, ni si tenemos suficientes datos para respaldarlos. No sabemos cuánto costará su funcionamiento y cuántos modelos comerciales podrán generar suficientes ingresos para cubrir ese costo.

No sabemos si las alucinaciones del modelo de lenguaje grande pueden eliminarse, o si el misterioso valle del conocimiento, donde las IA producen versiones convincentes de realidades que no existen, seguirá siendo un factor limitante.

No sabemos en qué dirección crecerán los modelos. Todo lo que sabemos es que el proceso de crecimiento y exploración se nutrirá de cada vez más datos y más computación.

Y eso requerirá una nueva ola de centros de datos, listos para enfrentar el desafío.

Otros artículos de esta serie

14 Jul 2023

IA generativa y el futuro de los centros de datos: Parte I - Los modelos

Un reportaje de siete partes sobre lo que significan los grandes modelos de lenguaje y la próxima ola de cargas de trabajo para el diseño de centros de datos
17 Jul 2023

IA generativa y el futuro de los centros de datos: Parte II - Los jugadores

Detrás de la IA generativa y su impacto en la industria
18 Jul 2023

IA generativa y el futuro de los Data Centers: Parte III - Las supercomputadoras

¿Qué pasará con HPC en el mundo de la IA generativa?
19 Jul 2023

IA generativa y el futuro de los centros de datos: Parte IV - La nube

Cómo los hyperscalers planean dominar la IA generativa
20 Jul 2023

IA generativa y el futuro de los centros de datos: Parte V - Los chips

Una explosión de semiconductores para satisfacer las demandas de la IA
21 Jul 2023

IA generativa y el futuro de los centros de datos: Parte VI - La red

El CEO de DE-CIX explica cómo los centros de datos deben adaptarse

IA generativa y el futuro de los centros de datos: Parte VII - Los centros de datos

Centros de datos más grandes, racks más calientes

Edificios especializados

Dónde y cómo construir

Otros artículos de esta serie

IA generativa y el futuro de los centros de datos: Parte I - Los modelos

IA generativa y el futuro de los centros de datos: Parte II - Los jugadores

IA generativa y el futuro de los Data Centers: Parte III - Las supercomputadoras

IA generativa y el futuro de los centros de datos: Parte IV - La nube

IA generativa y el futuro de los centros de datos: Parte V - Los chips

IA generativa y el futuro de los centros de datos: Parte VI - La red

Etiquetas