Subscribe to our Newsletter!
By subscribing to our newsletter, you agree with our privacy terms
Home > IT Monitoring > Data Center > Energie-Messwerte bei Rechenzentren: NVidia schlägt neue Kennzahlen vor
Mai 25, 2024
NVidia hat sich als Hauptlieferant von Prozessoren für den Einsatz Künstlicher Intelligenz in aktuellen Rechenzentren-Systemen etabliert. Nun argumentiert das Unternehmen in seinem Blog: Rechenzentren brauchen eine neue Energieeffizienz-Kennzahl, die den Fortschritten der realen Anwendungen entspricht.
Die heute am weitesten verbreitete Formel misst die Effektivität der Energienutzung in Rechenzentren und ist unter dem Akronym PUE bekannt. „In den vergangenen 17 Jahren diente PUE dem Versuch, die Betreiber einem Ideal näher zu bringen, bei dem so gut wie keine Energie für Prozesse wie Umwandlung und Kühlung verschwendet wird“, so NVidia. Das Unternehmen kommentiert, dass dieser Mess-Standard den Anforderungen von Rechenzentren während des Aufstiegs von Cloud Computing gut gedient hat – und auch weiterhin nützlich sein wird.
Die PUE-Kennzahl wurde von der Green Grid Association entwickelt und ist seit ihrer Veröffentlichung im Jahr 2007 in der Rechenzentrumsbranche weit verbreitet. Seit 2016 gibt es eine neue Version: den Performance Indicator, der Kühlsysteme besser abbildet.
Für NVidia hat sich PUE in der aktuellen Ära der generativen KI als unzureichend erwiesen: Es misst nicht die nützliche Leistung von Rechenzentren, sondern nur die verbrauchte Energie. „Das wäre so, als würde man die Menge an Benzin messen, die ein Motor verbraucht, ohne die vom Auto zurückgelegte Strecke zu berücksichtigen“, heißt es auf dem Blog. NVidia zitiert dabei ein Dokument aus dem Jahr 2017, in dem fast 40 Standards aufgelistet sind, die spezifische Ziele im Zusammenhang mit der Leistung von Rechenzentren im Fokus haben. Dazu gehören Kühlung, Wasserverbrauch, Sicherheit und Kosten.
Ist von Metriken in Watt die Rede, wird nur die Eingangsleistung in einer bestimmten Umgebung gemessen, nicht aber die tatsächlich von den Systemen verbrauchte Energie oder die Effizienz des Verbrauchs. NVidia weist darauf hin, dass moderne Rechenzentren in der Tat mehr verbrauchen, das heißt sie geben eine höhere Eingangsleistung in Watt an – was aber nicht unbedingt bedeutet, dass sie weniger energieeffizient sind.
Der Hersteller schlägt daher vor, dass die Metriken für moderne Rechenzentren die bekannte Einheit kWh (Kilowattstunde) oder Joule verwenden, um das Ausmaß der Arbeit zu erfassen.
Rechenzentren, die mit KI-Systemen arbeiten, verwenden häufig MLPerf-Benchmarking-Tools. Supercomputing-Zentren, die sich mit wissenschaftlicher Forschung befassen, nutzen in der Regel andere Messwerte. Daneben entstehen mit der wachsenden Zahl von Anwendungen immer mehr MLPerf-Tests, die zwei neue generative KI-Modelle verwenden.
Auch der Ingenieur Christian Belady, von dem die ursprüngliche Idee für PUE stammt, plädiert für andere Messgrößen, die für die heutigen Rechenzentren relevanter sind. „Als Heiliger Gral gelten dabei Leistungsmetriken. Man kann verschiedene Arbeitslasten nicht direkt miteinander vergleichen, aber wenn wir nach Arten von Arbeitslasten segmentieren, haben wir meiner Meinung nach eine bessere Chance auf Erfolg“, sagt Belady, der weiterhin an Initiativen zur Förderung der Nachhaltigkeit von Rechenzentren arbeitet.
Ein weiterer Forscher stimmt dieser Ansicht zu: „Um gute Entscheidungen in Bezug auf die Effizienz zu treffen, benötigen die Betreiber von Rechenzentren Benchmarking-Tools, die den Energieverbrauch und daraus gewonnene Leistung der heute am häufigsten eingesetzten KI-Arbeitslasten messen“, sagt Jonathan Koomey, der auf dem Gebiet Recheneffizienz und Nachhaltigkeit forscht.
Koomey erklärt, dass Unternehmen sich an offenen Diskussionen beteiligen, Informationen über ihre eigenen Arbeitslasten austauschen und realistische Tests durchführen müssten. Dies würde helfen sicherzustellen, dass die Messwerte den Energieverbrauch von Hardware, auf der reale Anwendungen laufen, genau charakterisieren. „Wir brauchen ein offenes öffentliches Forum, um diese wichtige Aufgabe zu bewältigen“, so der Forscher.
Letzten Monat hat das Uptime Institute ein neues Tool zur Bewertung der Nachhaltigkeit digitaler Infrastrukturen angekündigt. Damit sollen sich die nachhaltigen Merkmale von Rechenzentren bewerten und vergleichen lassen. Die aus der Bewertung gewonnenen Daten können zur Förderung kontinuierlicher Verbesserungen in 14 Hauptkategorien und mehr als 50 Unterkategorien für mehr Nachhaltigkeit genutzt werden. Zu den Hauptbereichen gehören Energie- und Wasserverbrauch, Kohlendioxidemissionen und das Abfallaufkommen.
Da die Bewertung lokale und regionale Anforderungen berücksichtigt, kann sie weltweit angewandt werden und einen einzelnen Standort oder eine verteilte Hybridanlage abdecken.
Jüngste und immer wiederkehrende Untersuchungen des Uptime Institutes legen nahe, dass viele Betreiber von Rechenzentren und IT-Einrichtungen sich noch in einem frühen Stadium ihrer Nachhaltigkeitsbemühungen befinden. Laut dem jüngsten Bericht „Sustainability strategies face greater pressure in 2024“ (Nachhaltigkeitsstrategien stehen im Jahr 2024 unter größerem Druck) erstellen weniger als die Hälfte der Betreiber digitaler Infrastrukturen (41 %) Daten und Berichte über den Wasserverbrauch, und nur 23 % tun dasselbe für die drei Bereiche Scope 1, 2 und 3 der Co2-Emissionen.
August 24, 2024
August 19, 2024
August 15, 2024
August 10, 2024
August 02, 2024
Juli 29, 2024
Juli 23, 2024
Juli 15, 2024
Previous
Neue Prozessoren für Rechenzentren: Google wird drittgrößter Entwickler
Next
Nscale führt AMD GPU-basierte Cloud-Dienste ein