NVidia propone nuevas métricas energéticas para los centros de datos

data centers
Sheila Zabeu -

mayo 29, 2024

Los centros de datos necesitan una nueva métrica de eficiencia energética que represente los avances de las aplicaciones del mundo real. Esto es lo que sostiene en su blog NVidia, el principal proveedor de procesadores para su uso con los actuales sistemas de Inteligencia Artificial en centros de datos.

La fórmula más utilizada en la actualidad mide la eficacia del uso de la energía y se conoce por las siglas PUE. «Durante los últimos 17 años, PUE ha tratado de acercar a los operadores a un ideal en el que casi no se desperdicia energía en procesos como la conversión y la refrigeración», afirma NVidia, comentando que esta métrica ha servido bien a las demandas de los centros de datos durante el auge de la computación en nube y seguirá siendo útil.

La métrica PUE fue desarrollada por  The Green Grid Association y se ha utilizado ampliamente en el sector de los centros de datos desde su publicación en 2007. En 2016 obtuvo una nueva versión, el Indicador de Rendimiento, que se centra más en los sistemas de refrigeración.

Para NVidia, el PUE ha demostrado ser insuficiente en la era actual de la IA Generativa, porque no mide el rendimiento útil de los centros de datos, sino sólo la energía consumida. «Esto equivaldría a medir el volumen de gasolina que consume un motor sin tener en cuenta la distancia recorrida por el coche», explica el blog. NVidia cita un documento de 2017 que enumera casi tres docenas de normas con objetivos específicos asociados al rendimiento de los centros de datos, como la refrigeración, el uso del agua, la seguridad y los costes.

Cuando hablamos de métricas en vatios, sólo estamos midiendo la potencia de entrada en un entorno determinado, no la energía real utilizada por los sistemas ni la eficiencia del consumo. NVidia señala que, de hecho, los centros de datos modernos consumen más, es decir, declaran una mayor potencia de entrada en vatios, pero esto no significa necesariamente que sean menos eficientes energéticamente.

NVidia sugiere que las métricas de los centros de datos modernos utilicen la unidad kWh (kilovatio-hora) o joule, que mide la magnitud del trabajo.

Qué miden los centros de datos

Los centros de datos que trabajan con sistemas de IA suelen utilizar herramientas de evaluación comparativa MLPerf. Los centros de supercomputación que trabajan en investigación científica suelen utilizar otras medidas. Y con el creciente conjunto de aplicaciones, están surgiendo más pruebas MLPerf que utilizan dos nuevos modelos de IA Generativa.

Según Christian Belady, el ingeniero al que se le ocurrió la idea original del PUE, tenemos que centrarnos en otras métricas más relevantes para los centros de datos actuales. «El Santo Grial serían las métricas de rendimiento. No se pueden comparar diferentes cargas de trabajo directamente, pero si segmentamos por tipos de cargas de trabajo, creo que tendremos más posibilidades de éxito”, afirma Belady, que sigue trabajando en iniciativas para impulsar la sostenibilidad de los centros de datos.

Otro investigador coincide con esta opinión. «Para tomar buenas decisiones en términos de eficiencia, los operadores de centros de datos necesitan herramientas de evaluación comparativa que midan las implicaciones energéticas de las cargas de trabajo de IA más utilizadas hoy en día», afirma Jonathan Koomey, del área de eficiencia computacional y sostenibilidad.

Koomey explica que las empresas tendrán que participar en debates abiertos, compartir información sobre sus propias cargas de trabajo y realizar pruebas realistas para garantizar que las métricas caracterizan con precisión el consumo energético del hardware que ejecuta aplicaciones en el mundo real. «Necesitamos un foro público abierto para llevar a cabo esta importante tarea», comenta el investigador.

Más que eficiencia energética

El mes pasado, el Uptime Institute anunció un servicio para evaluar la sostenibilidad de las infraestructuras digitales. Con esta herramienta es posible evaluar y comparar las características sostenibles de los centros de datos. Los datos obtenidos de la evaluación pueden utilizarse para promover mejoras continuas en 14 categorías principales y más de 50 subcategorías de sostenibilidad. Entre las principales figuran el consumo de energía y agua, las emisiones de carbono y la generación de residuos.

Como tiene en cuenta los requisitos locales y regionales, la evaluación puede aplicarse en todo el mundo, abarcando un solo emplazamiento o un conjunto híbrido distribuido.

Las recientes y recurrentes investigaciones de Uptime Intelligence sugieren que muchos operadores de centros de datos y entornos informáticos se encuentran aún en una fase temprana de su camino hacia la sostenibilidad. Según el último informe «Las estrategias de sostenibilidad se enfrentan a una mayor presión en 2024», menos de la mitad de los operadores de infraestructuras digitales recopilan e informan sobre el uso del agua (41%) y solo el 23% hace lo mismo con los tres alcances (1,2 y 3) de las emisiones de carbono.