Por Peter Judge, editor global do DataCenterDynamics

No inverno, o mundo estará controlando o consumo de energia, já que os preços estão nas alturas. Os Data Centers se perguntarão se ainda podem gerar ganhos quando os preços da eletricidade subirem. Pelo menos duas empresas de Data Center fecharam culpando a crise energética, uma no Reino Unido e outra na Irlanda.

Qual é o impacto do setor de Data Center no consumo mundial de energia? É uma pergunta importante para os formuladores de políticas, mas parece que as respostas não são confiáveis.

A maioria dos profissionais dos Data Centers vai encolher os ombros e dizer que as instalações usam “em torno de dois por cento da eletricidade mundial”. Dirão que a fonte dos números veio de um artigo de jornal, uma empresa de pesquisas ou dos slides feitos pelo seu próprio departamento de marketing. Também podem dizer que escutaram que o uso da energia do Data Center está se estabilizando, graças à virtualização e à nuvem.

Outros darão uma cifra mais alta, destacando que os Data Centers usam sete por cento da eletricidade ou um pouco mais em alguns países, e vão no caminho de usar 51 por cento da eletricidade do mundo para 2030. Se você perguntar sobre a fonte da cifra, eles provavelmente vão citar um grupo diferente de artigos jornalísticos, analistas e marketing.

¨Esta não é uma boa base para discussão¨, afirma o empresário e acadêmico David Mytton, que rastreou estas estimativas até as fontes, para ver de onde vem as discrepâncias. É um trabalho importante, porque dados incorretos podem trazer más decisões.

"Esta grande variação... serve para confundir o público em geral, que quer ajudar a abordar os problemas ambientais", explicam Mytton e o seu colega Masao Ashtine, no artigo "Fontes das estimativas de energia do Data Center: uma revisão integral" para a revista científica Joule Review. Pode resultar em esforços inadequados para a economia de energia, por exemplo, ao eliminar fotos antigas das redes sociais.

Ainda mais importante, as cifras pouco confiáveis significam que os operadores de Data Centers não tratam o problema com seriedade, as redes de energia não podem planejar suas demandas, é impossível obter uma imagem real do papel dos Data Centers no aquecimento global, e estamos vendo uma série de argumentos acalorados mas que não levam a nenhum lugar.

“A demanda inesperada pressiona a transmissão de eletricidade e também a capacidade de distribuição local, que precisa de muito tempo de antecipação para as atualizações e pode ter efeitos secundários em outros usuários da rede elétrica", diz Mytton.

Três distritos no oeste de Londres aprovaram novos Data Centers que utilizam eletricidade equivalente a dezenas de milhares de lares. Como resultado, os projetos de implantação de casas não podem conseguir conexões.

Na Irlanda, a demanda de energia aumentou 144% em cinco anos (de 1,2 TWh em 2015 a 3,0 TWh em 2020). A previsão é que os Data Centers utilizem 27 por cento de toda a demanda de eletricidade da Irlanda em 2029, e vários operadores têm atrasado ou cancelado projetos de Data Centers no país.

Em 2020, Amsterdam parou a construção de Data Center por causa da preocupação pela demanda de energia e terra do setor.

Enquanto isso, 15 por cento da eletricidade da Dinamarca será utilizada por Data Centers em 2030 segundo se projeta.

Em todos esses casos, melhores previsões poderiam ter evitado pausas ou cancelações do tipo.

Quando a eletricidade é vista no contexto do uso total de energia, as coisas se tornam complexas. A maior parte da eletricidade ainda é gerada a partir de combustíveis fósseis, assim o uso da eletricidade dos Data Centers contribui talvez com dois ou três por cento das emissões globais de CO2 (uma cifra baseada em conjecturas).

Inclusive pode ajudar se os Data Centers optarem pela energia verde. Mas os países têm uma quantidade limitada de eletricidade de fontes renováveis: se os Data Centers a usam, há menos disponível para o aquecimento das casas e transporte, que são setores que precisam se descarbonizar com urgência.

Os dados errados fazem que isso seja um campo minado para os responsáveis políticos, deixá- los à merced de alegações especiais.

A indústria dos Data Centers pode afirmar que o processo de digitalização pode ser uma ajuda na descarbonização (a chamada "pegada de carbono" ). Por exemplo, se as reuniões de Zoom substituem as viagens de negócios, outros dirão que nenhum setor deveria obter um passe gratuito para aumentos ilimitados no uso da energia.

Sem dados precisos, os legisladores não podem equilibrar estes dois argumentos.

“A falta de informação precisa sobre o consumo de energia do Data Center e como crescerá já está tendo um impacto”, dizem Mytton e Ashtine.

Números confiáveis

Para sua análise, Mytton e Ashtine coletaram informações sobre o uso de energia do Data Center publicados nos últimos 16 anos, um período que remonta ao lançamento da Amazon Web Services, dando início à era da nuvem em 2006.

Querem ajudar a indústria a produzir melhores cifras do uso de energia: “Não pretendemos criticar publicações individuais nem sugerir que uma estimativa em particular é mais precisa que outra. Nosso objetivo é a análise ampla dos problemas metodológicos comuns dentro dessa área de investigação para que os futuros leitores possam ter mais confiança nos números”.

Qualquer estudo é tão bom quanto seus dados: "Nós focamos na procedência da fonte e nas entradas dos dados porque são o componente fundamental que determina a veracidade científica".

Mytton e Ashtine analisaram frases de artigos anteriores, utilizando "diagramas de Sankey". (Fig. 2) Muitos deles se referem à primeira análise importante de energia do Data Center, encomendada pelo Congresso dos Estados Unidos e elaborada em 2007 por investigadores do Lawrence Berkeley National Labs (LBNL), incluindo Jon Koomey, Arman Shehabi, entre outros. Também existe um documento de 2008 de Koomey, Worldwideelectricityusedindatacenters.

Os dois estudiosos verificaram qualquer publicação em inglês que tentasse calcular o consumo de energia dos Data Centers, já seja mundialmente ou dentro de uma região como os EUA ou a Europa.

No total, o resultado foi uma lista com 46 publicações. Isso pode parecer surpreendentemente uma quantidade pequena de 16 anos de investigação sobre um tema tão importante, mas há uma razão para isso. Muitas publicações simplesmente citam ou se referem a outras.

Seguindo esses estudos, Mytton e Ashtine encontraram 676 "rastros de procedência de dados" individuais ou fontes originais de dados. Muitos deles já não estão disponíveis, seja porque os links não funcionam ou porque não há rastro do documento original. Algumas eram informações comerciais que englobavam apenas o pesquisador original, e outras não incluíam nenhuma metodologia de pesquisa.

O problema com os dados que faltavam é que a informação pode ter estado disponível no momento que eles foram publicados, mas não está agora: “Os links não são permanentes e as páginas web utilizadas como referências já não estão disponíveis (um problema particular quando citamos a Cisco).

A problemática é agravada pelas poucas fontes de dados existentes no mercado, que geralmente só estão disponíveis em relatórios ou bases de dados privados/comerciais.

Os relatórios normalmente se baseiam em dados secundários. Por exemplo, a quantidade de energia utilizada pelos servidores em um ano determinado geralmente é estimada de acordo com a quantidade de servidores enviados, usando-los para estimar a quantidade em uso durante esse ano, e a partir disso, a provável quantidade de energia que usavam esses servidores.

Algumas fontes foram citadas mais que outras. Por exemplo, apesar da dificuldade de ver seus dados em primeira mão, as empresas de pesquisas IDC e Cisco foram citadas em 43 por cento e 30 por cento das publicações, respectivamente. A dependência real dessas cifras é maior, porque alguns documentos citam outros que se baseiam em dados da Cisco ou do IDC sem fazer referência explícita a eles.

E há dúvidas sobre a veracidade (dos dados), já que somente um terço das fontes provém de publicações revisadas. Outros 38 por cento eram simplesmente de "estudos", o que pode significar publicações da indústria ou artigos auto editados. Algumas análises chegaram a ser artigos publicados, apesar de não terem ano de publicação.

Os documentos trabalharam os dados de diferentes maneiras: alguns citaram as emissões de carbono, outros o uso direto da energia. Para que a comparação seja possível, todos usaram as mesmas unidades: teravatios hora (TWh) por ano.

Estimativas e extrapolação

Vale a pena enfatizar que todas essas cifras do uso da energia citadas são estimativas. Não existe uma autoridade energética única que classifique e englobe a todos os consumidores de energia do mundo, ou inclusive em regiões individuais.

As análises usam diferentes métodos para reunir suas fontes e calcular uma estimativa do uso de energia do Data Center, depois usam outros pontos de dados e suposições para extrapolá-los e dar uma cifra provável para o uso de energia no futuro.

“Também adotam focos tão diferentes que compará-los pode ser um pesadelo”, diz Mytton: "Koomey exclui os componentes de armazenamento e rede, Somavat e outros pegam o total de EE. UU. de Brown e outros, e duplicam supondo que os Estados Unidos representam a metade do total global, Andrae e Edler excluem as redes internas do Data Center, em vez de contá-las como parte da rede global em seu conjunto."

Para analisar tudo isso e produzir cifras, existem essencialmente três enfoques: de baixo para cima, de cima para baixo e extrapolação.

O modelo ascendente combina cifras como o consumo de energia dos servidores com estimativas da base instalada e multiplica pela eficiência média do uso de energia (PUE) dos Data Centers para obter uma cifra de quanta energia é usada na instalação.

Está bem, mas é possível que as cifras publicadas não sejam um quadro completo. Por exemplo, algumas análises baseiam o uso de energia nos dados de referência do SPECpower, mas isto pode estar errado. Uma avaliação de Van Heddeghem e dos seus colegas concluiu que a base de dados SPECpower está sesgada por servidores de mais eficiência energética, enquanto que os servidores de volume menos eficientes são o maior grupo por consumo de energia.

O problema piora quando o modelo tem que projetar o uso de energia em função das cifras atuais e das tendências observadas. Isso é complicado, porque os equipamentos podem ser trocados, se tornarem mais eficientes, ou pelo contrário começarem a aparecer mais sistemas que consomem mais energia devido a uma mudança a tarefas mais exigentes.

“Quanto mais longe, mais amplo o rango de estimativas devido à dificuldade de incluir as melhoras na eficiência energética e as tendências que mudam constantemente os equipamentos", diz Mytton.

O artigo do LBNL de 2007 trouxe um excelente exemplo dos perigos da extrapolação. O estudo concluiu que o uso de energia do Data Center nos EUA cresceu 90 por cento entre 2000 e 2005, e alertou que isto seria insustentável a longo prazo.

Mudanças futuras

Mas o que aconteceu desde 2016? É possível que os benefícios proporcionados pela nuvem estejam chegando ao limite, e que os Data Centers hyperscale estejam empurrando uma grande expansão dos serviços ao consumidor.

Em 2007, o relatório do LBNL descartou os Data Centers hyperscale, considerando estes como insignificantes. A sequela deste estudo de 2016 dirigido por Arman Shehabi calculou que a capacidade de hyperscale representaria mais de 40 por cento de toda a base instalada de servidores de 2020.

Parece que existem mais Data Centers de hyperscale nos EUA (cerca de 400 de uma frota mundial de 700). “Este foco nos EUA foi sugerido como a razão pela qual o consumo de energia do Data Center segue aumentando em regiões fora dos Estados Unidos, porque os Estados Unidos se beneficiaram das eficiências melhoradas de estas instalações", explica Mytton.

A criptomoeda é outra grande incógnita que as estimativas de energia têm problemas para digerir. Surgiu - por completo - durante 2006, já que o documento técnico inicial de Bitcoin foi publicado em 2008, e agora o uso da energia por parte das criptomoedas é debatido acaloradamente, e é considerado tão grande como um país pequeno.

Em julho deste ano, Digiconomist estimou em 132,05 TWh por ano o consumo de energia do Bitcoin (aproximadamente o consumo de eletricidade da Suécia). Outras estimativas situam a cifra em 80 TWh (o consumo de eletricidade da Bélgica). Mesmo que existam outros aplicativos de blockchain, se calcula que a Bitcoin representa dois terços da demanda total de energia de criptomoedas.

Esses números são significativos em comparação com as estimativas da energia total do Data Center no mundo.

Os pesquisadores de energia do Data Center podem ter problemas para obter dados reais do mercado de criptomoedas, mas ignoram a situação sob seu próprio risco.

Inclusive, o impacto das novas tecnologias nos Data Centers é difícil de prever. A refrigeração líquida poderia substituir as unidades de ar condicionado que consomem muita energia e que se utilizam nos Data Centers atualmente.

Mytton alerta que: “Existe uma expectativa geral de que a refrigeração líquida direta dos equipamentos dos Data Centers sejam implementadas amplamente nos próximos sete anos, mas poucos operadores atualmente têm bastidores de alta densidade que a justifiquem".

O modelo de cima para baixo poderia ser mais confiável nas estatísticas atuais, porque se baseia em "dados reais" em forma de números regionais proporcionados por estatísticas governamentais. Entretanto, esses estudos são considerados “estranhos”, por causa da dificuldade de conseguir esse tipo de dados: Mytton e Ashtine só encontraram um estudo de cima para baixo, do Jens Malmodin, que é muito respeitado, mas só englobou a Suécia.

Há sinais de que o cenário possa estar mudando. Em janeiro de 2022, o Escritório Central de Estatísticas da Irlanda publicou as cifras de consumo de eletricidade do Data Center, baseadas nas leituras reais do medidor recopiladas pela ESB Networks. Esses números serão atualizados anualmente, para que a política futura em um dos mercados do Data Center mais controversos possa se basear em bons dados.

Entretanto, é difícil para o modelo de cima para baixo prever as tendências futuras. Os modelos de extrapolação tomam uma linha de base de um dos outros modelos e logo assumem que existe uma correlação entre a demanda e o consumo para aplicar um fator de crescimento.

“A maioria dos cálculos de extrapolação se baseiam na intensidade energética pela unidade de dados transmitidos, com algumas suposições sobre melhorias na eficiência energética para projeções futuras”, disse Mytton.

Isso pode produzir discrepâncias. Por exemplo, quando Anders Andrae e Peter Corcoran analisaram as estimativas ascendentes de Koomey, utilizaram uma taxa de crescimento maior, porque os novos serviços na nuvem para o consumidor vão impulsionar o crescimento e a demanda de energia, inclusive se os serviços forem mais eficientes.

Os documentos de Andrae tendem a calcular a energia média utilizada por instrução do CPU e logo extrapolar a quantidade de instruções do CPU que o mundo usará em um ano determinado.

Quanta energia?

Por causa da diversidade dos dados, não surpreende que Mytton e Ashtiane não apresentem uma cifra sólida para o uso de energia do Data Center. Em qualquer caso, este não era o seu objetivo.

No total, o documento encontra 258 estimativas do consumo de energia do Data Center, incluindo 179 para todo o mundo, 24 para os EUA e 19 para a Europa. Essas cifras da "Europa" cobrem outro nível de diversidade, já que englobam uma variedade de grupos dependendo de se são incluídas a UE, os EUA ou outros países. Também há estimativas de somente um país para Alemanha, Suécia e China.

Analisando os números globais, existe um bom acordo referente à quantidade de energia que usavam os Data Centers em 2010, mas as estimativas divergem em 2020, e para 2030, estão a quilômetros de distância.

“Quanto mais longe no futuro, mais amplos são os números”, diz o documento. "Isso é de se esperar já que os números anteriores podem ser calculados a partir de dados reais, enquanto as estimativas futuras devem fazer suposições sobre parâmetros chave como a eficiência energética e os envios de servidores".

Mytton e Ashtine ressaltam uma diferença de ordem de magnitude entre as previsões menores e maiores para o uso total de energia do Data Center em 2030: de 146 TWh a 1929 TWh por ano.

A cifra real é ainda maior, porque excluíram cinco estimativas atípicas que prognosticam que a energia do Data Center aumentaria até 8253 TWh por ano.

A maioria dessas variações ocorre devido à impossibilidade de prever as mudanças tecnológicas. “Por um lado, a mineração de blockchain de prova de trabalho requer uma quantidade significativa de energia, mas por outro lado, muitas cargas de trabalho de TI foram transferidas de Data Centers empresariais ineficientes a sistemas na nuvem de hyperscale mais eficientes”, afirma Mytton.

“O telefone inteligente se tornou importante com processadores mais eficientes energeticamente comparado com os computadores de escritórios, mas restam as dúvidas sobre o perfil de potência das novas redes celulares 5G”.

A mudança ocorre

O grande problema com as previsões é que a extrapolação aumentará e expandirá as debilidades existentes nos dados. “Este sesgo de bola de neve é um problema. As publicações se baseiam em estimativas anteriores sem avaliar criticamente as suas suposições e fontes”, adverte Mytton.

Por exemplo, é bastante crítico com o trabalho de Anders Andrae, um analista empregado pelo Huawei, que publicou três documentos de projeção em 2019, que se baseiam na suposição de que o uso de energia estaria relacionado com o tráfego da rede. Isto foi adotado pelo grupo de especialistas francês, The Shift Project, em seu documento Lean ICT - Towards Digital Sobriety .

“Apesar da falta de disponibilidade da maioria das fontes que respaldam as estimativas publicadas pelo The Shift Project, este relatório foi citado por uma grande quantidade de meios de comunicação”, dizem Mytton e Ashtine.

Essa suposição, que tinha um vínculo direto entre o tráfego da rede e o consumo de energia, foi reciclada sem avaliar desde 2013, mas foi refutada por Jens Malmodin e Dag Lunden em ao menos dois artigos.

Em particular, há evidência direta dos últimos dois anos. Houve uma mudança ao trabalho home office durante a pandemia, que aumentou o tráfego da rede e não se informou sobre o aumento no uso de energia.

Vale la pena mencionar que aunque el informe de Shift Project se cita regularmente, se destaca en los diagramas Sankey de Mytton, por una razón bastante equivocada. Todas menos dos de sus principales fuentes ya no están disponibles.

O que necessitamos agora

Necessitamos dados melhores para trabalhar nas estratégias futuras, o que significa que as empresas privadas que administram a nuvem e os Data Centers devem ser mais transparentes.

Mytton reconhece que a Google e a Microsoft abriram o caminho, com a publicação das estatísticas de alto nível sobre o consumo de energia, compras de energia renovável e cifras do PUE.

“Outros grandes proprietários de Data Centers não são tão transparentes”, diz Mytton. “Amazon informa um número único para as emissões de carbono, que engloba todas as suas operações e, portanto, dificulta a separação dos Data Centers da logística do comércio eletrónico”.

Os três maiores fornecedores de nuvem de hyperscale dão aos seus clientes uma calculadora para mostrar a pegada de carbono das suas cargas de trabalho na nuvem.

“Esta transparência é importante porque a migração das cargas de trabalho de TI para a nuvem subcontrata as emissões operativas de executar essa infraestrutura ao fornecedor da nuvem", disse Mytton. Obviamente, também é um bom marketing, já que os recursos da nuvem geralmente consumirão menos energia que os recursos que se executam internamente.

Os fornecedores de colocation e os operadores de Data Centers como Digital Realty e Equinix também apresentam algumas cifras, mas a pesquisa do Uptime Institute sugere que é mais provável que os proprietários de Data Centers informem mais sobre sua eficiência energética (que tem um impacto nos custos) que sobre as emissões de carbono e os efeitos ambientais.

As cifras reais de energia das criptomoedas são vitais para os governos que desejam que a energia esteja disponível para uso regular. "Foi demonstrado que as simples proibições das atividades de mineração de criptomoedas provocam o deslocamento a regiões mais intensivas em carbono", alerta Mytton.

Fundamentalmente, os Data Centers podem ser construídos (e estão sendo construídos) mais rápido que a capacidade de energia, trazendo “quebra de braços” em Amsterdam, Londres, Irlanda e outros lugares.

“A solução para limitar a demanda, apresentada por Amsterdam, pode trazer segurança para que o operador da rede possa oferecer atualizações de infraestrutura adequadas. Mas também impõe restrições à capacidade dos provedores de TI para aumentar os seus serviços dentro da região", disse Mytton.

“Quando a demanda supera a oferta, os preços inevitavelmente aumentam. Isso pode ter um impacto negativo na capacidade das pessoas com menos recursos acessarem serviços digitales”.