Konsortium will Ultra-Ethernet-Standard entwickeln

ethernet switches
Sheila Zabeu -

August 11, 2023

Die Zukunft der Hochleistungskommunikation hat einen Namen: Das Ultra Ethernet Consortium (UEC) vereint führende Unternehmen, um eine auf dem Ethernet-Standard basierende Kommunikationsarchitektur zu entwickeln, die auf Hochleistungsnetzwerke ausgerichtet ist. Bisherige Erkenntnisse des neuen Konsortiums lauten: Arbeitslasten im Bereich der künstlichen Intelligenz (KI) und des Hochleistungsrechnens (HPC) entwickeln sich rasch weiter und erfordern mehr Funktionalität, Leistung, Interoperabilität sowie Gesamtbetriebskosten. Der Ultra Ethernet Solution Stack nutzt die Allgegenwärtigkeit und Flexibilität des heutigen Ethernets, um diese und andere Arten an leistungsfordernden Arbeitslasten zu bewältigen – und dabei kostengünstig zu bleiben.

„Es geht nicht darum, Ethernet neu zu gestalten. Die Aufgabe ist, es so abzustimmen, dass die Effizienz für Arbeitslasten mit spezifischen Leistungsanforderungen erhöht wird. Wir analysieren jede Schicht – von der physikalischen bis zur Software – um einen Weg zu finden, die Leistungsergebnisse im großen Maßstab zu verbessern“, erklärt J. Metz, Vorsitzender des Ultra Ethernet Consortium.

Wichtige Gründungsmitglieder des Ultra Ethernet Consortium sind AMD, Arista, Broadcom, Cisco, Eviden (Atos Business), HPE, Intel, Meta und Microsoft. Die Gruppe wird daran arbeiten, Änderungen am Kommunikationsstack zu minimieren. Gleichzeitig steht auf der Agenda, die Interoperabilität von Ethernet zu erhalten und zu fördern. Das technische Ziel des Konsortiums ist die Entwicklung von Spezifikationen, APIs und Quellcode um folgende Punkte zu definieren:

  • Protokolle, elektrische sowie optische Signalisierungsmerkmale, APIs und/oder Datenstrukturen für die Kommunikation über Ethernet
  • End-to-End-Transportprotokolle auf Verbindungsebene zur Erweiterung oder zum Ersatz bestehender Transport- und Verbindungsprotokolle
  • Überlastungs-, Telemetrie- und Signalisierungsmechanismen auf der End-to-End-Verbindungsebene – jeweils geeignet für KI, maschinelles Lernen und Hochleistungsrechnerumgebungen
  • Software-, Speicher-, Verwaltungs- und Sicherheitskonstrukte zur Erleichterung verschiedener Arbeitslasten und Betriebsumgebungen

Das Konsortium verfolgt dabei einen systematischen Ansatz mit modularen, kompatiblen und interoperablen Schichten mit enger Integration. Das Ziel ist, eine ganzheitliche Verbesserung für leistungsfordernde Arbeitslasten zu erreichen. In insgesamt vier Arbeitsgruppen leisten die UEC-Gründungsmitglieder äußerst wertvolle Beiträge: (1) physikalische Ebene, (2) Verbindungs-, (3) Transport- und (4) Software-Schicht.

Als Projekt der Joint Development Foundation wird die UEC von der Linux Foundation unterstützt. Bewerbungen für neue Mitglieder werden ab dem vierten Quartal 2023 unter ultraethernet.org entgegengenommen.

Ethernet-VorteilNach Angaben der UEC arbeiten viele große Cluster bereits jetzt über Ethernet-Netzwerke – und zwar mit Hyperscale-Implementierungen von GPUs, die für das KI-Training Verwendung finden. Sie nutzen dabei Vorteile wie diese:

  • ein großes Ökosystem an Anbietern von interoperablen Switches, NICs, Kabeln, Transceivern, optischen Systemen, Management-Tools und Software

  • IP-Netzadressierung und -Routing, die den Aufbau von Netzen in verschiedenen Größenordnungen ermöglichen – von Racks bis zu Rechenzentren

  • ein breites Spektrum an Tools zum effizienten Testen, Messen, Bereitstellen und Betreiben von Ethernet-Netzwerken

  • Kostensenkung auf der Grundlage eines wettbewerbsfähigen Ökosystems und Skaleneffekten

  • IEEE-Ethernet-Standards mit der Fähigkeit, sich schnell und regelmäßig über viele physikalische sowie optische Ebenen hinweg weiterentwickeln

Trotz dieser Eigenschaften des heutigen Ethernets müssen diese Netze ein noch nie dagewesenes Maß an Leistung, Umfang und Bandbreite bieten. Laut UEC ist es notwendig, die „Tail Latency“ zu minimieren – und um dies zu erreichen, muss die Spezifikation erheblich verbessert werden. Folgende Anforderungen gilt es deshalb zu erfüllen:

  • Multipathing
  • flexible Zustellungsanfragen
  • modernere Mechanismen zur Staukontrolle
  • End-to-End-Telemetrie
  • mehr Umfang, Stabilität und Zuverlässigkeit

Schon bald dürfte es erste Produkte geben, die mit dem Ethernet-Standard kompatibel sind. Die Prognose des Konsortium lautet, dass bereits 2024 erste Launches erfolgen werden.