A inteligência artificial (IA) e a computação de alto desempenho (HPC) emergiram como áreas críticas de oportunidade para inovação e transformação de negócios.

O desafio para os líderes de TI é habilitar essas cargas de trabalho de alta densidade com a infraestrutura de TI certa, e cada vez mais a comunidade discute tecnologias avançadas de resfriamento, como resfriamento líquido.

Embora hoje o resfriamento líquido direto (DLC) esteja sendo implementado em Data Centers mais do que nunca, você ficaria surpreso ao saber que estamos implementando isso em nossos projetos de Data Center na Digital Realty desde 2015? Você também sabia que o resfriamento líquido nem sempre é a escolha certa para toda carga de trabalho de IA e HPC de alta densidade?

Neste post, abordarei os conceitos básicos das necessidades de resfriamento de Data Center para cargas de trabalho de alta densidade, como IA e HPC, e como o legado de inovação da Digital Realty nos preparou para apoiar a aceleração da demanda por técnicas avançadas de resfriamento de todos os tipos, incluindo resfriamento líquido.

Também compartilharei estudos de caso de nossa jornada de inovação que demonstram como viabilizar a inovação é ter a estratégia certa e os parceiros certos, em vez de uma abordagem única para todos.

Necessidades de resfriamento de cargas de trabalho de alta densidade

A densidade de uma implantação de IA e HPC determina suas necessidades exclusivas de resfriamento.

Os requisitos de densidade de energia para IA e HPC podem ser de cinco a dez vezes maiores do que outros casos de uso de Data Center. As cargas de trabalho tradicionais tendem a ficar na faixa de cinco a oito kW por rack.

Em 2024, é provável que algum hardware de computação possa permitir densidades de energia superiores a 100kW/rack e a densidade de pico no Data Center possa chegar a 150kW/rack nos próximos dois anos.

As densidades de carga de trabalho tradicionais podem ser resfriadas a ar, mas, em termos gerais, a maioria dos fluxos de trabalho de IA e HPC requer resfriamento especializado, como resfriamento líquido direto (DLC), resfriamento líquido com assistente de ar (AALC) e um trocador de calor na porta traseira.

Nem todas as cargas de trabalho de IA e HPC exigem resfriamento líquido

Os requisitos para resfriamento líquido variam de acordo com o fornecedor do hardware, o hardware específico em si e o tipo de carga de trabalho. O resfriamento líquido não é apropriado para todo o hardware e todos os cenários.

Mesmo na era da IA, nem todos os racks terão 100kW e podem nem mesmo exigir refrigeração avançada especializada.

Por exemplo, as implementações de inferência tendem a consumir menos energia do que as implementações de treinamento e podem ser resfriadas com técnicas tradicionais de resfriamento a ar. O aprendizado de máquina requer menos recursos, enquanto o aprendizado profundo e a IA generativa exigem ambientes maciços por sua complexidade.

É importante que os líderes de TI entendam que diferentes cargas de trabalho de IA e HPC têm necessidades de resfriamento diferentes e que nem todos os parceiros de Data Center terão o conhecimento especializado e os recursos de infraestrutura para habilitar a tecnologia.

Os requisitos para cada implementação variam, por isso é importante trabalhar com um parceiro que projetará uma solução personalizada e não dependerá de uma abordagem única para todos. É por isso que o legado de experiência em design de Data Center da Digital Realty com resfriamento avançado faz a diferença para nossos clientes.

Estratégias de inovação

A plataforma global de Data Center da Digital Realty, PlatformDIGITAL,® foi escolhida para ser o lar de muitas cargas de trabalho inovadoras de IA e HPC.

Aprendemos que, para permitir a inovação, algumas estratégias essenciais nos ajudam não apenas a acompanhar o ritmo da tecnologia, mas a ficar um passo à frente.

As estratégias de TI para dar suporte a fluxos de trabalho de IA e HPC devem permitir:

  • Agilidade
  • Escala
  • Crescimento sustentável

Esses estudos de caso de nossa própria jornada de inovação na última década destacam essas estratégias em ação. Eles também demonstram como nossa experiência e estratégia de inovação nos ajudam a identificar a solução certa para a situação, em vez de confiar em uma abordagem única para todos.

Estudos de caso de inovação

Habilitar escala: um mecanismo de negociação de alta capacidade com resfriamento líquido

2015 foi um ano transformador para nós da Digital Realty; Foi também o meu primeiro ano na empresa. Embarcamos em um projeto ambicioso para construir a base para uma empresa global de serviços financeiros especializada em negociação algorítmica de alta frequência.

Uma parte significativa desse empreendimento foi uma mudança estratégica do resfriamento a ar tradicional para o resfriamento líquido avançado até o nível de chip para suportar clusters de HPC. Essa façanha de engenharia não apenas aumentou a eficiência do sistema de resfriamento, mas também significou que pudemos escalar nossa tecnologia para continuar a dar suporte ao nosso cliente à medida que sua implantação crescia para quase 6MW.

Investir na tecnologia de refrigeração líquida de próxima geração foi uma decisão que sabíamos que capacitaria o nosso cliente além de suas necessidades imediatas e estabeleceria uma capacidade com foco na escalabilidade e sustentabilidade de longo prazo.

Permitir o crescimento sustentável: Supercomputação com design adaptável

Recentemente, fizemos uma parceria com um cliente europeu para desenvolver um ambiente sofisticado de supercomputadores que incluía até 70kW por rack em um ambiente misto. O cliente precisava implementar rapidamente e, ao mesmo tempo, cumprir as novas regulamentações de sustentabilidade.

Esperar de três a cinco anos para construir um novo Data Center não era uma opção, e é por isso que nossa capacidade de modernizar as instalações existentes coloca os clientes em funcionamento mais rapidamente. Tomando uma instalação de eficiência energética que construímos em 2013, conseguimos atender aos seus exigentes requisitos de alta densidade de energia e conectividade com alterações mínimas em nossas instalações. Isso permitiu uma implantação 400% mais rápida.

Nosso cliente projetou uma melhoria de 30% na eficiência energética ao mudar para o resfriamento líquido. Eles também se beneficiaram do sistema de resfriamento de armazenamento de energia térmica (ATES) do aquífero da Digital Realty e de fontes de energia totalmente renováveis para atingir as metas de CO2 estabelecidas pelos regulamentos locais de sustentabilidade.

Nossa capacidade de desenvolver projetos de retrofit mostra nosso compromisso com o design de ponta e ágil que permite um crescimento sustentável e oportuno. Nossos princípios de design garantem que nossa infraestrutura atenda não apenas às necessidades atuais, mas também aos requisitos décadas no futuro.

Permita agilidade: uma implementação de IA generativa flexível e preparada para o futuro

Hoje, estamos desempenhando um papel fundamental no avanço da IA generativa (GenAI). Estamos trabalhando com um cliente que está integrando mais de 30.000 dos GPUs mais avançadas em uma plataforma maciça.

Para habilitar o desempenho de computação avançada, a implantação requer que cada GPU esteja conectada em um único cluster de computação. Eles precisavam de um fornecedor de plataforma de Data Center que pudesse ajudá-los a implementar rapidamente para começar a obter o valor de seu investimento em GPU, o que era ainda mais desafiador dados seus requisitos de design especializados.

Nossa estratégia de investimento visa antecipar a demanda futura, o que nos permitiu combiná-los com uma instalação pronta para conchas com projetos prontos. Nossa abordagem de design ágil e modular nos permitiu resolver seus complexos desafios de projeto, mantendo 99% do projeto original, o que significava que poderíamos começar a construir mais cedo.

Nossa abordagem ágil permitirá que eles implementem em até 12 meses, em vez dos 36 meses necessários com a construção personalizada. Os requisitos de nossos clientes estão mudando rapidamente, assim como a tecnologia e as soluções para atendê-los – é por isso que a agilidade precisa ser uma estratégia central para permitir a inovação.

Mesmo que esta seja a definição de uma carga de trabalho avançada de IA, o resfriamento líquido direto não foi a melhor escolha para o resfriamento. Esse é um bom exemplo de por que uma abordagem única para resfriamento de carga de trabalho de alta densidade não funciona.

Além da infraestrutura: fomentando uma cultura de inovação

Para executar essas estratégias de inovação, outro elemento fundamental é a sua equipe de pessoas. Para todos os líderes de TI, é importante lembrar que nossas conquistas não são apenas sobre infraestrutura; são sobre a cultura de inovação que cultivamos.

Na Digital Realty, nossas talentosas equipes trazem um legado de inovação e engenharia pelo qual recebemos vários prêmios como pioneiros no espaço do Data Center.

Nossa cultura de inovação na Digital Realty permite o alinhamento com nossos clientes, garantindo que nossos parceiros estejam confortáveis de que podem crescer com a Digital Realty no futuro.

Uma visão de futuro

Meu papel como diretor de tecnologia da Digital Realty é entender as necessidades tecnológicas de nossos clientes e garantir que a Digital Realty possa auxiliar essas necessidades, não apenas para hoje, mas para amanhã.

Ao olharmos para o futuro, continuamos dedicados a não apenas participar do cenário tecnológico, mas moldá-lo ativamente. Nossa missão é viabilizar a inovação de nossos clientes, possibilitando agilidade, escala e crescimento sustentável.

A sustentabilidade é particularmente importante para nós. Continuamos a expandir nossa cobertura de fontes de energia renováveis e livres de carbono para acompanhar a demanda dos clientes – temos mais de um gigawatt de energia solar e eólica sob contrato – e começamos a usar soluções de energia secundária de combustível alternativo para reduzir ainda mais a pegada de carbono do ciclo de vida de nossos Data Centers.

Vamos nos concentrar em aplicar a melhor tecnologia no tempo para atender às necessidades de nossos clientes, em vez de implantar o status quo por atacado e forçar os clientes de amanhã a aceitar as limitações de ontem. Essa abordagem é o que permitiu que a Digital Realty servisse aos exemplos destacados ao longo deste post.

Nossa adaptabilidade, espírito inovador e herança rica são o que nos tornam uma empresa única e duradoura no mundo da tecnologia em constante evolução.

A construção de um legado de inovação não acontece da noite para o dia, mas na Digital Realty aprendemos que estamos sempre na direção certa quando somos fiéis aos nossos valores e focados em como podemos atender melhor às necessidades de nossos clientes.

Junte-se a nós na Digital Realty enquanto continuamos a definir o futuro da tecnologia. Mantenha-se inovador, entre em contato conosco e vamos implementar IA e HPC de uma forma que transforme sua organização.