A adoção recorde do ChatGPT levantou enorme interesse – e investimento – em IA generativa.

A capacidade do ChatGPT e de outros Large Language Models (LLMs) de preencher a lacuna linguística entre humanos e máquinas conquistou o imaginário popular e aumentou a conscientização sobre o potencial de automatizar e melhorar muitos aspectos de nossas vidas.

Gostaria de fazer uma breve análise desta nova tecnologia fenomenal do ponto de vista da infraestrutura digital de que necessitará para ter sucesso e de como dois desafios fundamentais – a energia e o lixo eletrónico – exigirão uma atenção especial.

Mudança de rumo

A IA generativa alimentará cada vez mais aplicações na próxima década. O ChatGPT, DALL-E, GitHub Copilot e o Stable Diffusion são apenas a primeira geração, criando e classificando imagens, respondendo a perguntas complexas, criando sites e tornando a programação acessível a todos.

Os Data Centers da Iron Mountain fornecem a infraestrutura para muitas configurações de computação de alta potência (HPC) que executam IA generativa. Hoje, energia de alta densidade, arquitetura modular, conectividade de treinamento (entrada) e inferência (saída) de alta largura de banda e resfriamento avançado são fatores críticos para os clientes.

Apoiar essas novas aplicações, que prometem acelerar a inovação e até salvar vidas, tem sido um processo fascinante e iniciar a mudança de rumo no design de infraestrutura que nossa indústria terá que fazer.

Aumento de energia

De longe, o maior desafio no suporte à IA generativa é um enorme aumento nas cargas de energia. Os modelos de IA generativa usam chips de unidade de processamento gráfico (GPU) que exigem de 10 a 15 vezes a energia de uma CPU tradicional. Muitos modelos têm bilhões de parâmetros e exigem escoamentos de dados rápidos e eficientes em sua fase de treinamento, que pode levar meses para ser concluído.

O ChatGPT 3.5, por exemplo, tem 175 bilhões de parâmetros e foi treinado em mais de 500 bilhões de palavras de texto. Para treinar um modelo ChatGPT 3.5 são necessários 300-500MW de potência.

Atualmente, um Data Center típico requer de 30 a 50MW de potência. Um dos maiores campi do IMDC, no norte da Virgínia, tem capacidade para 10 Data Centers. Seria necessária toda a carga de energia para este campus para treinar o ChatGPT 3.5. Embora os LLMs estejam definitivamente no final mais ávido de energia do boom da IA generativa, cada modelo generativo com o qual trabalhamos tem necessidades de processador e energia que crescem exponencialmente, dobrando ou triplicando a cada ano.

É difícil de prever os requisitos de energia da IA generativa ao longo do tempo com precisão, mas a maioria dos analistas concordaria que ela aumentará enormemente os requisitos atuais. Se estimarmos o crescimento composto atual do Data Center em relativamente modestos 15% (provavelmente está perto de 20), a capacidade global dobrará em cinco anos e quadruplicará em 10.

Com a IA generativa no meio disso tudo, o CAGR pode subir até 25%, triplicando a capacidade em cinco anos e aumentando-a nove vezes em uma década. Empresas, startups de IA e fornecedores de serviços em nuvem já estão correndo para proteger a capacidade do Data Center para suas cargas de trabalho, com as nuvens de hiperescala liderando o pacote. Isso está acontecendo rápido. O analista TD Cowen relatou “um tsunami de demanda de IA”, com 2,1 GW de arrendamentos de Data Centers assinados nos EUA (um quinto da oferta total atual) no segundo trimestre de 2023.

Uma onda de lixo eletrônico

O segundo tsunami gerado por IA está no back-end; um fluxo de equipamentos usados. A IA está impulsionando a inovação de servidores mais rápida, particularmente no design de chips, e os chips de IA mais recentes, como o Nvidia H100, tiveram tantos bilhões avançados contra sua fabricação e estão tão escassos que estão até sendo usados como garantia de dívida e disponibilizados para aluguel.

Embora essa taxa de atualização seja fundamental para melhorar a eficiência, ela também – em conjunto com o aumento da capacidade – aumentará a escala do lixo eletrônico. O lixo eletrônico é um dos fluxos de resíduos que mais cresce no mundo. Até 2030, a produção anual de lixo eletrônico está a caminho de atingir impressionantes 75 milhões de toneladas.

Acredita-se que o lixo eletrônico global armazene cerca de 60 bilhões de dólares (295 bilhões de reais) em matérias-primas como ouro, paládio, prata e cobre. No entanto, apenas 17% do lixo eletrônico global é coletado e devidamente reciclado a cada ano.

À altura do desafio

Essas ondas na frente e atrás do Data Center ocorrerão à medida que a crise climática se aprofunda e as metas de emissão zero se aproximam. Haverá uma pressão sem precedentes sobre as redes de energia para fornecer nova energia elétrica para as indústrias que estão se livrando dos combustíveis fósseis. É justo dizer que a IA generativa, em particular, estará sob intenso escrutínio ambiental. Para enfrentar os desafios gêmeos de crescimento de capacidade e lixo eletrônico, a indústria terá que estar à altura.

Descarbonização e reciclagem

Fontes de energia de baixo e nenhum carbono serão essenciais para enfrentar os desafios de energia. As demandas de energia da IA generativa acelerarão esse foco e impulsionarão novas inovações em microrredes e fontes de energia de backup, como bateria, hidrogênio e nuclear. As energias renováveis também serão fundamentais.

A maioria dos hiperescalas e um número crescente de fornecedores de colocation têm aumentado a rede verde e eliminado o carbono a ponto de, hoje, os hiperescalas serem os maiores compradores de energias renováveis no mundo. Os proprietários de Data Centers agora precisarão dar mais um passo.

Reciclagem e remarketing

Novos chips e GPUs super-rápidas impulsionarão a revolução da IA, mas o que acontecerá com os antigos? Para desempenho eficiente e redução de impacto, os fornecedores de IA precisarão verificar se a otimização e a reciclagem do ciclo de vida dos ativos de TI, o remarketing e o descarte seguro estão disponíveis. Vemos um enorme potencial para esse segmento aumentar para dar suporte aos clientes de IA nos próximos anos.

Da mesma forma que a IA generativa revolucionará as indústrias que executam seus aplicativos, acredito que ela também revolucionará a indústria de infraestrutura que a auxilia.