Don Mitchell, colíder do projeto Cooling Environments na OCP, fez uma apresentação em 27 de setembro, no evento DCD>Connect Cancun. Ele falou sobre “O caminho aberto para o resfriamento líquido ITE em escala de nuvem”. Antes de sua apresentação, a DCD conversou com Don Mitchell sobre o tema.

Você pode dar uma visão geral do grupo de trabalho Open Compute Cooling Environments “OpenTCS” e seus objetivos no desenvolvimento de práticas e diretrizes globais e abertas para a implementação de equipamentos de TI refrigerados a líquido em escala de nuvem?

À medida que o resfriamento líquido de TI passa de configurações boutique para implantações de nuvem em grande escala, o design e a entrega do Sistema de Resfriamento de Tecnologia (TCS) devem evoluir. O Open Compute Project (OCP), que começou em 2011, inicialmente pretendia enfrentar os desafios da implantação de equipamentos de TI refrigerados a ar em escala de nuvem, promovendo abertura, eficiência e impacto positivo. Ao longo do tempo, o OCP cresceu para incluir mais de 300 organizações do setor e incorporou a sustentabilidade como um pilar fundamental.

Em 2017, o OCP reconheceu a importância do resfriamento líquido na TI e começou a adicionar grupos de trabalho dedicados a essa tecnologia. No entanto, foi apenas em 2023 que o resfriamento líquido em escala de nuvem em TI se tornou uma realidade. Essa mudança foi impulsionada pelo aumento do uso de aplicações de inteligência artificial, que exigiam densidades de chips que precisam de resfriamento líquido. Gigawatts de espaço de TI estão sendo alugados para suportar aplicativos de IA. O fornecimento de um gigawatt de sistemas TCS para TI refrigerada a líquido requer aproximadamente 1000 unidades de distribuição de refrigerante (CDUs), 16 milhas de conectores de distribuição e 40.000 linhas de bypass.

Semelhante aos desafios enfrentados em 2011, a cadeia de suprimentos da indústria global é atualmente incapaz de suportar efetivamente grandes volumes com abordagens proprietárias diversas.

Digite “OpenTCS”, um termo cunhado para abranger as melhores práticas e diretrizes que permitem o design aberto do TCS. O OpenTCS incentiva o uso de componentes intercambiáveis, como CDUs, cabeçalhos e bylines, abordando efetivamente os desafios de dimensionamento usando uma abordagem semelhante a “Legos”. Essa abordagem otimiza a eficiência, a abertura no design e a sustentabilidade, ao mesmo tempo em que promove a circularidade com impacto significativo. O mesmo espírito revolucionário que o OCP começou com o resfriamento a ar em TI continua agora com o advento do resfriamento líquido em TI, ultrapassando os limites da eficiência e sustentabilidade da infraestrutura de TI.

Quais são os principais desafios e considerações ao implementar soluções de resfriamento líquido para equipamentos de TI em ambientes de nuvem de grande escala e como o grupo de trabalho OpenTCS aborda esses desafios?

A implantação de soluções de resfriamento líquido para equipamentos de TI em ambientes de nuvem de grande escala apresenta vários desafios e considerações importantes. Tornar a Tecnologia do Sistema de Refrigeração (TCS) mais aberta e menos proprietária pode ajudar a enfrentar esses desafios. Aqui estão os principais desafios e como o design do "OpenTCS" pode mitigá-los:

Compatibilidade e interoperabilidade:

⦁ Desafio: Sistemas de refrigeração líquida de diferentes fornecedores podem não ser facilmente compatíveis ou interoperáveis, levando a problemas de integração.

⦁ Solução: Um projeto “OpenTCS” incentiva a padronização e compatibilidade entre diferentes soluções de resfriamento líquido, facilitando a mistura e combinação de componentes de vários fornecedores e abordando o desafio da atualização de TI sem alterar os sistemas de tubulação.

Integração com a infraestrutura existente:

⦁ Desafio: Adaptar sistemas de refrigeração líquida para se encaixarem na infraestrutura existente de um data center, especialmente em ambientes de nuvem de grande escala, pode ser complexo e caro.

⦁ Solução: Os projetos OpenTCS podem fornecer diretrizes e padrões para integrar perfeitamente soluções de resfriamento líquido ao hardware existente, reduzindo a complexidade e os custos.

Manutenção e capacidade de serviço:

⦁ Desafio: Os sistemas de refrigeração líquida requerem manutenção regular, e os sistemas proprietários podem ter opções de serviço limitadas.

⦁ Solução: Os projetos Open TCS podem promover a facilidade de manutenção ao padronizar componentes e procedimentos de manutenção, permitindo uma manutenção mais fácil e econômica.

Bloqueio do fornecedor:

⦁ Desafio: As soluções proprietárias da TCS podem levar ao bloqueio de fornecedores, dificultando a troca de fornecedores e a adoção de tecnologias alternativas.

⦁ Solução: Uma abordagem TCS aberta incentiva vários fornecedores a atender a padrões comuns, reduzindo o risco de bloqueio de fornecedores e dando às organizações mais flexibilidade na seleção de fornecedores.

Segurança e Confiabilidade:

⦁ Desafio: Os sistemas de refrigeração líquida apresentam riscos potenciais, como vazamentos de líquido refrigerante e falhas no sistema. Soluções personalizadas criam problemas personalizados.

⦁ Solução: Os projetos OpenTCS podem incluir padrões e diretrizes de segurança para melhorar a confiabilidade e a segurança dos sistemas de resfriamento líquido, incluindo detecção de vazamentos e medidas de prevenção.

Escalabilidade:

⦁ Desafio: Os ambientes de nuvem geralmente precisam ser dimensionados rapidamente, e as soluções proprietárias da TCS podem não se adaptar facilmente ao crescimento.

⦁ Solução: Os projetos OpenTCS podem ser projetados com escalabilidade em mente, facilitando a expansão da capacidade de resfriamento líquido à medida que os ambientes em nuvem crescem.

Custo e Custo Total de Propriedade (TCO):

⦁ Desafio: Gerenciar os custos iniciais e as despesas operacionais contínuas das soluções de resfriamento líquido, garantindo um TCO favorável pode ser um desafio.

⦁ Solução: Os projetos OpenTCS podem incentivar a competição entre fornecedores, potencialmente reduzindo custos e melhorando o TCO geral dos sistemas de resfriamento líquido.

Sustentabilidade e impacto ambiental:

⦁ Desafio: Reduzir o impacto ambiental e atingir as metas de sustentabilidade é um grande desafio para os data centers de grande porte.

⦁ Solução: Os projetos OpenTCS permitem circularidade e reutilização de componentes.

Em resumo, tornar a Tecnologia de Sistema de Resfriamento (TCS) mais aberta e menos proprietária pode abordar os principais desafios na implementação de soluções de resfriamento líquido para equipamentos de TI em ambientes de nuvem de grande escala. A abertura promove a compatibilidade, a integração, a facilidade de manutenção e a segurança, ao mesmo tempo em que reduz os riscos de bloqueio do fornecedor e promove escalabilidade, economia e sustentabilidade. Essa abordagem, em última análise, beneficia as organizações, dando-lhes maior flexibilidade e reduzindo a complexidade associada à adoção de tecnologias de resfriamento líquido.

Você poderia compartilhar algumas reflexões sobre os potenciais benefícios e ganhos de eficiência que as organizações podem obter ao adotar o resfriamento líquido para seus equipamentos de TI em escala de nuvem? Existem casos de sucesso específicos e estudos de caso que você possa destacar?

A adoção de resfriamento líquido para equipamentos de TI em escala de nuvem pode oferecer vários benefícios significativos e ganhos de eficiência para as organizações:

Maior eficiência energética:

⦁ O resfriamento líquido é altamente eficiente na remoção de calor em comparação com o resfriamento a ar. Isso pode resultar em menor consumo geral de energia, o que reduz os custos de eletricidade para data centers.

⦁ Ao refrigerar equipamentos de TI de forma mais eficaz, as organizações podem otimizar o uso de seu hardware e reduzir a necessidade de provisionamento excessivo, levando a uma maior economia de energia.

Computação de Maior Densidade:

⦁ O resfriamento líquido permite maior densidade de servidores dentro dos data centers. Os servidores podem ser colocados mais próximos uns dos outros porque o resfriamento líquido é melhor na dissipação de calor, permitindo uma melhor utilização do espaço.

⦁ O aumento de densidade pode resultar em economias significativas de custo e sustentabilidade, reduzindo a pegada física dos data centers e da infraestrutura associada.

Melhor desempenho:

⦁ O resfriamento líquido pode ajudar a manter o equipamento de TI em temperaturas ideais de forma consistente, o que pode levar a um melhor desempenho geral e redução do risco de tempo de inatividade relacionado ao superaquecimento.

⦁ Os servidores podem funcionar em velocidades de relógio mais altas e ter um desempenho mais eficiente quando mantidos mais frios, melhorando seu poder de processamento.

Vida útil prolongada do hardware:

⦁ Temperaturas de operação mais baixas podem prolongar a vida útil do hardware de TI. É menos provável que os componentes se degradem rapidamente e falhem prematuramente devido ao superaquecimento.

⦁ Isso pode resultar em menores custos de substituição de hardware e manutenção de hardware menos frequente.

Benefícios Ambientais:

⦁ Soluções de resfriamento líquido podem contribuir para a redução das emissões de carbono, redução da infraestrutura e redução do impacto ambiental.

⦁ Reaproveitamento de calor: O resfriamento líquido permite a remoção de calor em temperaturas mais elevadas e na forma líquida. O OCP tem um projeto de reutilização de calor que mapeia exemplos globais de reutilização de calor em data centers.

Redução de ruído:

⦁ Os sistemas de refrigeração líquida são normalmente mais silenciosos do que os sistemas de ar condicionado tradicionais, porque não requerem tantos ventiladores funcionando em altas velocidades.

⦁ Isso pode criar um ambiente de trabalho mais confortável para a equipe do data center e reduzir a poluição sonora na área circundante.

Adaptabilidade às tecnologias futuras:

⦁ Soluções de resfriamento líquido reduzem barreiras para muitas tecnologias emergentes.

Como a abordagem “aberta” promovida pelos Ambientes de Resfriamento de Computação Aberta beneficia o setor de TI em geral e incentiva a colaboração entre diferentes partes interessadas? Qual o papel da padronização nesse contexto e como ela afeta a adoção de soluções de resfriamento líquido?

A abordagem “aberta” promovida pelos Ambientes de Resfriamento de Computação Aberta beneficia o setor de TI como um todo e promove a colaboração entre diferentes partes interessadas de várias maneiras:

Interoperabilidade e compatibilidade:

⦁ Padrões abertos promovem a interoperabilidade entre vários componentes de hardware e software. No contexto do resfriamento líquido, isso significa que diferentes fabricantes podem produzir componentes e sistemas compatíveis.

⦁ A interoperabilidade simplifica a integração de soluções de resfriamento líquido na infraestrutura de data center existente, facilitando a adoção dessas tecnologias pelas organizações.

Redução de Custos:

⦁ As normas abertas conduzem frequentemente a um aumento da concorrência entre os fabricantes, o que pode reduzir os preços dos equipamentos de arrefecimento líquido e componentes relacionados.

⦁ Custos mais baixos tornam as soluções de refrigeração líquida mais acessíveis a uma gama mais ampla de organizações, independentemente do tamanho ou restrições orçamentárias.

Inovação e Colaboração:

⦁ Os padrões abertos incentivam a colaboração entre diferentes partes interessadas, incluindo operadores de data center, fabricantes de hardware e desenvolvedores de software.

⦁ A colaboração pode levar à inovação e ao desenvolvimento de tecnologias de refrigeração líquida mais eficientes e eficazes. Ao trabalhar em conjunto, a indústria pode enfrentar desafios comuns e promover a melhoria contínua.

Ignorando o bloqueio do fornecedor:

⦁ Soluções proprietárias podem levar ao bloqueio de fornecedores, onde as organizações dependem de um único fornecedor para suas necessidades de refrigeração. Os padrões abertos ajudam a evitar isso, permitindo que as organizações escolham entre uma variedade de fornecedores e soluções.

⦁ Evitar o bloqueio de fornecedores dá às organizações mais flexibilidade e controle sobre sua infraestrutura de TI.

Maior escalabilidade:

⦁ Padrões abertos podem simplificar o processo de escalabilidade das operações no data center. À medida que as organizações crescem, elas podem adicionar mais equipamentos de refrigeração líquida de diferentes fornecedores sem preocupações de compatibilidade.

⦁ A escalabilidade é crucial para operações em escala de nuvem e data centers de hiperescala.

Redução de Riscos:

⦁ Com padrões abertos, as organizações podem ter mais confiança na viabilidade a longo prazo de suas soluções de resfriamento líquido escolhidas. Eles não dependem apenas de tecnologia proprietária de um único fornecedor.

⦁ A redução de riscos pode ser especialmente importante para aplicações críticas e operações de data center.

Comunidade e Compartilhamento de Conhecimento:

⦁ Iniciativas como o Open Compute Project geralmente envolvem uma comunidade de especialistas e entusiastas que compartilham conhecimento e melhores práticas de forma aberta.

⦁ Esse compartilhamento de conhecimento ajuda as organizações a implementar soluções de resfriamento líquido de forma eficaz e eficiente.