A IA é um fenômeno que atualmente está tomando o mundo de assalto, e por boas razões. Mas e se disséssemos que a IA não é necessariamente um conceito novo?

Nascida de técnicas de HPC que estão em desenvolvimento nos últimos 20 a 40 anos, a IA aproveita décadas de dados e pesquisas do espaço de HPC, transformando-a em um modelo preditivo de IA.

“Fazemos muitas simulações em HPC, fazemos há décadas, mas de repente, surge a IA e agora estamos trazendo essas técnicas de HPC para esse espaço totalmente novo, resolvendo problemas de uma maneira radicalmente diferente. Não tenho certeza se estou vendo algum limite para isso ainda. Isso é muito importante e acho que vai mudar o mundo”, diz Brendan Bouffler, chefe de relações com desenvolvedores de engenharia de HPC da AWS.

Em um recente DCD>Talk com Alex Dickins, da DCD, Bouffler explica que isso significa essencialmente que simulações que antes levavam semanas, meses ou anos - por exemplo, a simulação de interações de moléculas para ajudar na descoberta de medicamentos - agora podem acontecer em ordens de magnitude mais rápidas.

Você provavelmente concordará que casos de uso medicinal, como a descoberta de medicamentos, são importantes, então você pensaria que esse tipo de avanço tecnológico faria os cientistas do mundo pularem de alegria, certo?

Infelizmente, quando ouvimos a palavra 'cientista', a mídia pode nos fazer imaginar uma equipe de grandes mentes, trabalhando duro em jalecos brancos dia após dia, para o bem da humanidade. O que você pode não imaginar é um bando de indivíduos frustrados esperando pelos recursos de computação de que precisam para alcançar avanços científicos.

“Em muitas instituições, essas pessoas podem esperar horas, dias e até semanas para obter recursos de computação”, diz Bouffler. “Se pudermos dar a essas pessoas as ferramentas de que precisam como e quando precisarem, podemos eliminar a espera, podemos movê-las para a próxima etapa de seu experimento, movê-las para a próxima iteração de sua teoria, muito mais rápido”.

Mas é claro que tempo é dinheiro. Portanto, mesmo que uma instituição tenha acesso a um supercomputador bilionário, provavelmente há centenas, talvez milhares de cientistas esperando para usá-lo, cujos salários - para não mencionar o custo do treinamento que os levou até onde estão em suas carreiras - eclipsam o custo desse computador.

“Para colocar isso em perspectiva, precisamos de mais computadores. Eles precisam ser mais eficientes e precisam ser capazes de fornecer recursos de computação maciços sempre que essas pessoas precisarem”, explica Bouffler.

Mas com o consumo global de energia de Data Centers previsto para dobrar entre agora e 2030 para quase 1.300 TWh – representando quase 5% do consumo global de eletricidade – como podemos colocar esses recursos nas mãos daqueles que precisam deles, da maneira mais eficiente em termos de energia?

A resposta está na computação em nuvem e na oferta de recursos de computação acelerada escaláveis e flexíveis, com tecnologia AWS e Nvidia, para atender às demandas de cargas de trabalho de HPC sempre que cientistas e engenheiros precisarem.

“É aqui que a Nvidia faz coisas realmente incríveis. Como obtemos o maior número possível de ciclos de computação para cada watt de calor que acabamos de bombear pela parte de trás? É por isso que as GPUs Nvidia são tão importantes para nós. Poderíamos construir supercomputadores ainda maiores feitos puramente de CPUs e executar toda essa IA neles, mas isso nos custaria mais eletricidade, geraria mais calor e causaria maiores danos à Terra”, explica Bouffler.

Para testar a eficiência da HPC alimentada por GPU, o Centro Nacional de Computação Científica de Pesquisa Energética dos EUA (NERSC) mediu a rapidez com que vários aplicativos eram executados em nodos somente de CPU e acelerados por GPU em sua infraestrutura de HPC mais recente, alimentada por GPUs Nvidia A100 Tensor Core. Ao mesmo tempo, mediu a energia consumida por esses aplicativos para calcular exatamente o quão eficiente em termos de energia a execução de aplicativos intensivos em HPC realmente é.

O NERSC descobriu que sua infraestrutura de HPC com tecnologia Nvidia era cinco vezes mais eficiente em termos de energia, em média. Em termos de economia de energia e custos, em um servidor com quatro GPUs Nvidia A100, o NERSC alcançou um aumento de 12 vezes no desempenho em comparação com um servidor x86 de soquete duplo.

Para o mesmo nível de desempenho, os pesquisadores do NERSC concluíram que o sistema acelerado por GPU da Nvidia consumiria 588 megawatts-hora a menos de energia por mês do que um sistema somente de CPU, totalizando uma economia de custos de cerca de 4 milhões de dólares (22,7 milhões de reais) executando a mesma carga de trabalho.

No geral, se todos os servidores de Data Center somente com CPU migrassem para GPUs Nvidia para cargas de trabalho de HPC, IA e análise de dados, as organizações economizariam 12 TWh anualmente – o que equivale a uma economia global de 2 a 3 bilhões de dólares (11 a 17 bilhões de reais).

“Podemos olhar para as GPUs e pensar, uau, elas são muito quentes e caras, mas para os resultados de computação que elas produzem, centenas de vezes mais eficientes do que você obteria de outra forma, isso é um grande negócio”.

“Quando você diminui o zoom e olha para isso do ponto de vista da infraestrutura mais ampla, quando você está olhando para a criação de edifícios cheios dessas coisas como fazemos, a maneira como você obtém eficiência energética é que você tem que fazer isso em escala”.

“Também precisamos mudar para uma base mais sustentável para todas as nossas fontes de energia e, novamente, é aí que achamos que a escala pode realmente entrar na festa. Acredito que agora a AWS é a maior compradora corporativa de energia renovável do mundo e estamos construindo nossos próprios parques eólicos e solares. Estamos no caminho certo, no momento, para cumprir nosso prazo muito agressivo de 2025 para que a Amazon seja neutra em carbono”.

É claro que, quando se trata de eficiência em escala, a Amazon está melhor posicionada do que a maioria, fato que não escapa a Bouffler.

“Se você estiver fazendo isso em seu próprio Data Center, não será capaz de fazê-lo no tipo de escala em que estamos, não será capaz de obter as eficiências que podemos espremer. Mas acho que esse é um dos lugares onde a nuvem pode contribuir particularmente para a forma como resolvemos esse problema”.

A AWS oferece serviços em nuvem desde 2006, reunindo computação, rede e armazenamento em Data Centers baseados em nuvem, o que permitiu uma grande melhoria na eficiência do Data Center. A mudança para HPC baseada em GPU Nvidia e IA generativa representa outro salto nessa área.

E à medida que a proliferação de computação mais barata e sustentável continua a aumentar, fica claro que parcerias como a AWS e a Nvidia são fundamentais para resolver os maiores desafios do mundo de hoje – e de amanhã – colocando esses recursos nas mãos daqueles que mais precisam deles, quando precisam.

Desde nos ajudar a responder aos grandes mistérios do universo, até curar doenças, juntos, podemos ajudar a catalisar a mudança que queremos ver no mundo, com menos custo para nós mesmos e nosso meio ambiente.

Saiba mais sobre como a AWS e a Nvidia podem ajudar a acelerar as cargas de trabalho de HPC aqui.