Subscribe to our Newsletter!
By subscribing to our newsletter, you agree with our privacy terms
Home > Monitoreo > Centro de datos > Retos de los centros de datos ante el avance de la IA
septiembre 20, 2023
El extraordinario crecimiento del uso de la Inteligencia Artificial (IA) en diversos sectores de actividad está planteando retos y exigiendo cambios en el diseño y el funcionamiento de los centros de datos para que puedan satisfacer una demanda cada vez mayor. Una estimación de Schneider Electric, empresa que opera en el campo de la gestión y automatización de sistemas energéticos, señala que la IA representa actualmente 4,3 GW de demanda energética, cifra que se espera que crezca a una tasa anual compuesta del 26% al 36%, resultando en un total de entre 13,5 GW y 20 GW para 2028.
Con este telón de fondo, Schneider Electric ha elaborado un documento en el que explica cómo los atributos y tendencias de la IA pueden crear retos para todos los elementos de la infraestructura física de los centros de datos, incluidos los sistemas de alimentación, refrigeración, racks y software de gestión. También ofrece orientación sobre cómo abordar estos retos y presenta una visión de lo que nos espera en términos de diseño de centros de datos.
“Con el avance de la IA, están surgiendo requisitos específicos en el diseño y la gestión de los centros de datos. Para hacer frente a los retos, es importante tener en cuenta diversos atributos y tendencias de las cargas de trabajo de IA que afectan tanto a los centros de datos nuevos como a los ya existentes”, afirma Pankaj Sharma, vicepresidente ejecutivo del negocio de energía segura y centros de datos de Schneider Electric. “Las aplicaciones de IA, especialmente los clústeres de entrenamiento, son muy exigentes en cuanto a la potencia de procesamiento proporcionada por las GPU o los aceleradores de IA especializados. Esto ejerce una presión significativa sobre la infraestructura de energía y refrigeración de los centros de datos. Y con el aumento de los costes energéticos y la preocupación por el medioambiente, los centros de datos necesitan adoptar hardware energéticamente eficiente, como sistemas de alimentación y refrigeración de alta eficiencia, y fuentes de energía renovables para ayudar a reducir los costes operativos y su huella de carbono”, añade.
Según la guía, hay cuatro atributos y tendencias de la IA que subyacen a los retos de la infraestructura física de los centros de datos: las cargas de trabajo de la IA (formación e inferencia), la potencia de diseño térmico (TDP) de la GPU, la latencia de la red y el tamaño de los clústeres de IA.
Los retos que plantean las cargas de trabajo de IA son: (1) distribución de 120/208 V poco práctica de desplegar; (2) pequeños bloques de distribución de energía que desperdician espacio; (3) PDU (unidades de distribución de energía) de rack estándar de 60/63 A poco prácticas de desplegar; (4) mayores riesgos generados por la formación de arcos eléctricos que complican las prácticas de trabajo; (5) falta de diversidad de carga que aumenta el riesgo de disparo de los disyuntores aguas arriba; y (6) altas temperaturas de rack que aumentan el riesgo de fallos y otros peligros.
En cuanto a la refrigeración, la densificación de los clústeres de servidores para la formación en IA está forzando la migración de la refrigeración por aire a la refrigeración líquida. Además, aunque los clústeres menos densos y los servidores de inferencia siguen utilizando métodos de refrigeración de centros de datos más convencionales, el estudio enumera los principales retos de refrigeración que deben abordarse: (1) refrigeración por aire inadecuada para clústeres de IA por encima de 20 kW/rack; (2) falta de diseños estandarizados y limitaciones del emplazamiento que complican la adopción de la refrigeración líquida; (3) TDP futuros desconocidos que aumentan el riesgo de obsolescencia del diseño de refrigeración; (4) inexperiencia que complica los procesos de instalación, operación y mantenimiento; (5) refrigeración líquida que aumenta el riesgo de fugas en el rack; y (6) opciones de fluidos limitadas para su uso en refrigeración líquida de forma sostenible.
En el caso de los bastidores, hay cuatro retos principales generados por las cargas de trabajo de IA: (1) bastidores de anchura estándar que no tienen espacio para equipos de alimentación y refrigeración; (2) bastidores de profundidad estándar que no tienen espacio para servidores de IA profundos y cableado; (3) bastidores de altura estándar que no tienen espacio para el número necesario de servidores; y (4) bastidores estándar que no pueden soportar el peso de los equipos de IA.
Mantener clústeres de alta densidad refrigerados por líquido junto a sistemas informáticos tradicionales refrigerados por aire hace que ciertas herramientas de software de gestión sean más críticas. Además, aunque algunas cargas de trabajo de formación de IA no requieran alta disponibilidad, un diseño y una supervisión inadecuados pueden provocar la inactividad de bastidores adyacentes críticos para la empresa. Los dos principales retos relacionados con el software de gestión en el contexto de las cargas de trabajo de formación de IA de alta densidad son: (1) las altas densidades de potencia y la demanda de clústeres de IA que generan incertidumbres de diseño; (2) los márgenes de error más pequeños que aumentan los riesgos operativos en un entorno dinámico.
En la guía se presentan directrices para ayudar a abordar cada uno de estos retos. Además, algunas tecnologías y enfoques de diseño futuros también deberían ayudar en este empeño: (1) rPDU (PDU de rack) optimizadas para IA; (2) tensión media para transformadores de 415/240 V; (3) transformadores de estado sólido; (4) disyuntores de estado sólido; (5) fluidos dieléctricos sostenibles; (6) racks informáticos ultraprofundos; y (7) mayor interacción/optimización con las redes.
octubre 23, 2023
septiembre 13, 2023
septiembre 08, 2023
julio 28, 2023
julio 21, 2023
julio 07, 2023
junio 14, 2023
Previous
Google crea un método para reducir el consumo energético de los centros de datos
Next
Europa registra un segundo trimestre con gran demanda de centros de datos