NVidia propõe adoção de nova métrica energética para data centers

data centers
Sheila Zabeu -

Maio 27, 2024

Data centers precisam de uma nova métrica de eficácia energética que represente os avanços das aplicações do mundo real. Isso é o que argumenta em seu blog a NVidia, principal fornecedora de processadores para uso com os atuais sistemas de Inteligência Artificial em data centers.

A fórmula mais usada atualmente mede a eficácia do uso de energia e é conhecida pela sigla PUE.  “Nos últimos 17 anos, a PUE buscou aproximar os operadores de um ideal em que quase nenhuma energia seria desperdiçada em processos como conversão e refrigeração”, afirma a NVidia, comentando que essa métrica atendeu bem às demandas dos data centers durante a fase de ascensão da computação em nuvem e continuará sendo útil.

A métrica PUE foi desenvolvida pela The Green Grid Association e é amplamente utilizada na indústria de data centers desde sua publicação em 2007. Ganhou uma nova versão em 2016, o Performance Indicator, que se concentra mais nos sistemas de refrigeração.

Para a NVidia, a PUE tem se mostrado insuficiente na era atual da IA Generativa, pois não mede a produção útil dos data centers, apenas a energia consumida. “Isso seria equivalente a medir o volume de gasolina que um motor consome sem levar em conta a distância percorrida pelo carro”, exemplifica o blog. A NVidia cita um documento de 2017 que lista quase três dúzias de padrões com objetivos específicos associados ao desempenho dos data centers, como refrigeração, uso de água, segurança e custos.

Quando se fala de métricas em watts, mede-se apenas a potência de entrada em um determinado ambiente, e não a energia real usada pelos sistemas nem a eficiência do consumo.  A NVidia ressalta que os data centers modernos estão, de fato, consumindo mais, ou seja, relatam potência de entrada mais elevada em watts, mais isso não significa necessariamente que sejam menos eficientes em termos energéticos.

A NVidia sugere que as métricas para data centers modernos usem a unidade kWh (quilowatt-hora) ou joule, que mede a grandeza trabalho.

O que os data centers usam como métrica

Data centers que trabalham com sistemas de em IA costumar usam as ferramentas de benchmarking MLPerf. Já os centros de supercomputação que trabalham com pesquisas científicas normalmente usam outras medidas. E, com o crescente conjunto de aplicações, estão surgindo mais testes MLPerf usando dois novos modelos de IA Generativa.

Segundo Christian Belady, engenheiro que teve a ideia original do PUE, precisamos nos concentrar em outras métricas mais relevantes para os data centers atuais. “O Santo Graal seria uma métrica de desempenho. Não é possível comparar diferentes cargas de trabalho diretamente, mas se segmentarmos por tipos de cargas de trabalho, acho que teremos mais chance de sucesso”, afirma Belady, que segue trabalhando em iniciativas para impulsionar a sustentabilidade dos data centers.

Outro pesquisador concorda com essa visão. “Para tomar boas decisões em termos de eficiência, os operadores de data centers precisam de ferramentas de benchmarking que meçam as implicações energéticas das cargas de trabalho de IA mais utilizadas atualmente”, destaca Jonathan Koomey, da área de eficiência e sustentabilidade computacionais.

Koomey explica que a empresas precisarão participar de discussões abertas, compartilhar informações sobre suas próprias cargas de trabalho e realizar testes realistas para garantir que as métricas caracterizem com precisão o consumo de energia do hardware que executa aplicações do mundo real. “Precisamos de um fórum público aberto para realizar essa importante tarefa”, comenta o pesquisador.

Mais do que eficiência energética

No mês passado, o Uptime Institute anunciou um serviço de avaliação de sustentabilidade de infraestruturas digitais. Com essa ferramenta, é possível avaliar e comparar as características sustentáveis de data centers. Os dados obtidos pela avaliação podem ser usados para promover melhorias contínuas em 14 categorias principais e mais de 50 subcategorias de sustentabilidade. As principais áreas incluem uso de energia e água, emissões de carbono e geração de resíduos.

Como leva em consideração requisitos locais e regionais, a avaliação pode ser aplicada em nível mundial, abrangendo um único local ou um conjunto híbrido distribuído.

Pesquisas recentes e recorrentes da Uptime Intelligence sugerem que muitos operadores de data centers e ambientes de TI ainda estão em estágio inicial em suas jornadas de sustentabilidade. De acordo com o último relatório “Sustainability strategies face greater pressure in 2024”, menos de metade dos operadores de infraestruturas digitais está compilando e reportando o uso de água (41%) e apenas 23% fazem o mesmo em relação aos três escopos (1,2 e 3) de emissões de carbono.