tech 8 min • intermediate

Sostenibilidad y Eficiencia en la Evolución de los Centros de Datos

Cumpliendo Objetivos de Energía y Agua en los Centros de Datos de IA Modernos

Por AI Research Team
Sostenibilidad y Eficiencia en la Evolución de los Centros de Datos

Sostenibilidad y Eficiencia en la Evolución de los Centros de Datos

Cumpliendo Objetivos de Energía y Agua en Centros de Datos de IA Modernos

Introducción

A medida que la inteligencia artificial (IA) continúa impulsando la innovación tecnológica, el desafío de gestionar sosteniblemente los inmensos recursos de los centros de datos que sostienen estos avances se vuelve cada vez más significativo. El crecimiento exponencial en las cargas de trabajo de IA exige un cambio de paradigma en la forma en que se diseñan, operan y enfrían los centros de datos. Hoy en día, lograr la sostenibilidad en los centros de datos no solo significa optimizar el uso de la energía, sino también gestionar eficazmente los recursos hídricos. Este artículo explora cómo los centros de datos de IA modernos están evolucionando para alcanzar estos objetivos mediante tecnologías de enfriamiento innovadoras y rediseños arquitectónicos.

La Necesidad de Rediseño en los Centros de Datos de IA

Las cargas de trabajo de IA, notablemente en grupos de entrenamiento y de inferencia a gran escala, imponen enormes demandas a la infraestructura de los centros de datos. Con densidades de potencia en rack alcanzando los 30–200 kW y más allá, el calor generado por dispositivos como los aceleradores H100 de NVIDIA y MI300X de AMD requiere métodos de enfriamiento avanzados. Los centros de datos enfriados tradicionalmente con aire luchan por mantener la eficiencia a medida que aumenta la densidad de los equipos, requiriendo un cambio hacia soluciones más robustas.

Innovaciones en Enfriamiento

Para abordar la alta producción de calor de las cargas de trabajo de IA, los centros de datos están recurriendo a soluciones centradas en líquidos. El enfriamiento líquido directo al chip (DTC) se está convirtiendo en un enfoque preferido, utilizando placas frías para eliminar el calor directamente en la fuente. Este método no solo admite mayores densidades de rack, hasta 120+ kW, sino que también reduce la energía de los ventiladores del servidor, llevando a ganancias significativas en eficiencia. Los sistemas enfriados por líquido mejoran la Efectividad de Reuso de Energía (ERE) al elevar las temperaturas de retorno del agua, permitiendo el reutilizo del calor para calefacción distrital o procesos industriales.

El enfriamiento por inmersión, otra técnica de vanguardia, sumerge servidores en fluido dieléctrico, permitiendo que los centros de datos logren densidades de potencia aún mayores. A pesar de los beneficios, como PUEs tan bajos como 1.05, el enfriamiento por inmersión requiere una gestión cuidadosa de los fluidos y diseños estructurales para soportar el peso adicional.

Manejo de Retos de Densidad y Potencia

Entregar alta potencia eficientemente en ambientes densos requiere innovación tanto en el diseño eléctrico como estructural. Los racks de alta densidad a menudo emplean sistemas de potencia de 415/240 V y vías de bus aéreas para limitar las pérdidas y mejorar la seguridad. Los estándares del Open Compute Project y Open19 apoyan esta evolución al promover la modularidad y la interoperabilidad multivendedor, esenciales para manejar la complejidad de los centros de datos modernos.

Además, los componentes de red en los centros de datos de IA, como ópticas de 800G y conmutadores de 51.2T, contribuyen con cargas térmicas significativas que deben ser gestionadas explícitamente. El enfriamiento efectivo es crucial para prevenir el estrangulamiento y mantener la integridad de los datos.

Hacia una Mayor Modularidad

La construcción de centros de datos modulares prefabricados (PFM) y módulos de GPU en contenedores se ha convertido en una estrategia viable para abordar las presiones de tiempo de comercialización y limitaciones de recursos. Estas soluciones modulares permiten un despliegue rápido y la escalabilidad, esenciales para mantener el ritmo con los avances de la IA. Al utilizar marcos e interfaces estándar, como los del Open Compute Project, los centros de datos pueden reducir los requisitos de ingeniería personalizada y simplificar las operaciones.

Consideraciones de Sostenibilidad y Económicas

Con el promedio global de Power Usage Effectiveness (PUE) estancado cerca de 1.58, hay una necesidad urgente de que los centros de datos adopten nuevas tecnologías de enfriamiento que puedan lograr cifras de PUE en el rango de 1.1 a 1.2. Los sistemas de enfriamiento líquido, combinados con métodos de enfriamiento seco, reducen significativamente el consumo de agua, alineándose con objetivos regulatorios y de sostenibilidad ambiental, especialmente en regiones con escasez de agua.

Además de la eficiencia energética, las iniciativas de reutilización de calor están ganando fuerza, como lo ejemplifica el Centro de Datos Odense de Meta, que se integra exitosamente con redes de calefacción distrital para exportar calor residual para uso comunitario. Estos proyectos no solo contribuyen a reducir las huellas de carbono operativas sino que también presentan nuevas avenidas para beneficios económicos a través de la reutilización de energía.

Conclusión

La evolución de los centros de datos en la era de la IA requiere un enfoque comprometido hacia la sostenibilidad y la eficiencia. La transición hacia el enfriamiento centrado en líquidos y arquitecturas modulares no solo satisface las demandas de cargas de trabajo de IA de alta densidad, sino que también allana el camino para operaciones de centros de datos más sostenibles. A medida que las regulaciones se endurecen y los recursos se vuelven más escasos, el empuje de la industria hacia soluciones innovadoras en enfriamiento, distribución de energía y diseño modular será clave para lograr metas de sostenibilidad futuras y apoyar un paisaje tecnológico que avanza rápidamente.

Fuentes

  1. ASHRAE Datacom Series (incl. Directrices de Enfriamiento Líquido) ASHRAE Datacom Series Esta fuente proporciona directrices críticas sobre enfriamiento líquido en centros de datos, apoyando reivindicaciones de beneficios en eficiencia energética.

  2. Open Compute Project – Advanced Cooling Solutions (ACS) Open Compute Project Esto demuestra cómo los estándares abiertos fomentan la interoperabilidad y la eficiencia, crucial en el diseño moderno de centros de datos.

  3. Uptime Institute Global Data Center Survey 2023 (tendencias de PUE) Uptime Institute Los promedios globales del PUE destacados en esta encuesta subrayan la necesidad de soluciones de enfriamiento más eficientes.

  4. GRC – Visión General del Enfriamiento por Inmersión de Fase Única GRC Cooling Proporciona conocimientos sobre la practicidad y beneficios del enfriamiento por inmersión al gestionar altas densidades de cómputo.

  5. Meta – Recuperación de Calor del Centro de Datos Odense Meta – Heat Recovery Ofrece ejemplos de iniciativas exitosas de reutilización de calor en centros de datos, respaldando reivindicaciones sobre mejoras en sostenibilidad.

Fuentes y Referencias

www.ashrae.org
ASHRAE Datacom Series (incl. Liquid Cooling Guidelines) This source provides critical guidelines on liquid cooling in data centers, supporting claims of energy efficiency benefits.
www.opencompute.org
Open Compute Project – Advanced Cooling Solutions (ACS) This demonstrates how open standards foster interoperability and efficiency, crucial in modern data center design.
uptimeinstitute.com
Uptime Institute Global Data Center Survey 2023 (PUE trends) The global PUE averages noted in this survey highlight the need for more efficient cooling solutions.
www.grcooling.com
GRC – Single-Phase Immersion Cooling Overview Provides insights into the practicalities and benefits of immersion cooling in managing high compute densities.
about.fb.com
Meta – Odense Data Center Heat Recovery Offers examples of successful heat reuse initiatives in data centers, underpinning claims about sustainability enhancements.

Advertisement