tech 8 min • intermediate

Durabilité et efficacité dans l'évolution des centres de données

Atteindre les objectifs énergétiques et hydriques dans les centres de données d'IA modernes

Par AI Research Team
Durabilité et efficacité dans l'évolution des centres de données

Durabilité et Efficacité dans l’Évolution des Centres de Données

Atteindre les Objectifs Énergétiques et en Eau dans les Centres de Données Modernes pour l’IA

Introduction

À mesure que l’intelligence artificielle (IA) continue de stimuler l’innovation technologique, le défi de gérer durablement les immenses ressources des centres de données soutenant ces avancées devient de plus en plus significatif. La croissance exponentielle des charges de travail de l’IA exige un changement de paradigme dans la conception, l’exploitation et le refroidissement des centres de données. Aujourd’hui, atteindre la durabilité dans les centres de données signifie non seulement optimiser l’utilisation de l’énergie, mais aussi gérer efficacement les ressources en eau. Cet article explore comment les centres de données modernes pour l’IA évoluent pour atteindre ces objectifs grâce à des technologies de refroidissement innovantes et des reconceptions architecturales.

Le Besoin de Reconcevoir les Centres de Données pour l’IA

Les charges de travail d’IA, notamment les clusters d’entraînement et l’inférence à grande échelle, exercent une énorme pression sur l’infrastructure des centres de données. Avec des densités de puissance de rack atteignant 30–200 kW et au-delà, la chaleur générée par des dispositifs tels que les accélérateurs H100 de NVIDIA et MI300X d’AMD nécessite des méthodes de refroidissement avancées. Les centres de données traditionnels refroidis par air peinent à maintenir leur efficacité à mesure que la densité des équipements augmente, nécessitant un passage à des solutions plus robustes.

Innovations dans le Refroidissement

Pour faire face à la forte production de chaleur des charges de travail IA, les centres de données se tournent vers des solutions centrées sur le liquide. Le refroidissement direct par puce (DTC) par liquide devient une approche privilégiée, utilisant des plaques froides pour éliminer directement la chaleur à la source. Cette méthode prend en charge non seulement des densités de rack plus élevées — jusqu’à 120+ kW — mais réduit également l’énergie des ventilateurs de serveur, conduisant à des gains d’efficacité significatifs. Les systèmes refroidis par liquide améliorent l’efficacité de la réutilisation de l’énergie (ERE) en élevant les températures de retour de l’eau, permettant la réutilisation de la chaleur pour le chauffage urbain ou les processus industriels.

Le refroidissement par immersion, une autre technique de pointe, immerge les serveurs dans un fluide diélectrique, permettant aux centres de données d’atteindre des densités de puissance encore plus élevées. Malgré les avantages, tels que des PUE aussi bas que 1.05, le refroidissement par immersion nécessite une gestion attentive des fluides et des conceptions structurelles pour supporter le poids supplémentaire.

Gerer les Défis de Densité et de Puissance

Fournir une haute puissance de manière efficace dans des environnements denses nécessite des innovations tant dans la conception électrique que structurelle. Les racks haute densité utilisent souvent des systèmes de puissance 415/240 V et des busways aériens pour limiter les pertes et améliorer la sécurité. Les normes du Open Compute Project et d’Open19 soutiennent cette évolution en promouvant la modularité et l’interopérabilité multi-fournisseurs, essentielles pour gérer la complexité des centres de données modernes.

De plus, les composants de réseautage dans les centres de données IA, tels que les optiques 800G et les commutateurs 51.2T, contribuent à des charges thermiques significatives qui doivent être gérées explicitement. Un refroidissement efficace est crucial pour prévenir les limitations et maintenir l’intégrité des données.

Vers une Plus Grande Modularité

La construction de centres de données modulaires préfabriqués (PFM) et de pods GPU en conteneurs est devenue une stratégie viable pour répondre aux pressions de temps de mise sur le marché et aux contraintes de ressources. Ces solutions modulaires permettent un déploiement rapide et une évolutivité, essentiels pour suivre le rythme des progrès de l’IA. En utilisant des cadres et interfaces standards, comme ceux du Open Compute Project, les centres de données peuvent réduire les besoins en ingénierie sur mesure et rationaliser les opérations.

Considérations de Durabilité et Économiques

Avec une efficacité énergétique moyenne globale (PUE) stagnante autour de 1.58, il est urgent pour les centres de données d’adopter de nouvelles technologies de refroidissement qui peuvent atteindre des chiffres de PUE dans la gamme de 1.1 à 1.2. Les systèmes de refroidissement par liquide, combinés aux méthodes de refroidissement à sec, réduisent considérablement la consommation d’eau, correspondant aux objectifs réglementaires et de durabilité environnementale, surtout dans les régions où les ressources en eau sont rares.

En plus de l’efficacité énergétique, les initiatives de réutilisation de la chaleur gagnent du terrain, comme illustré par le centre de données Odense de Meta, qui s’intègre avec succès aux réseaux de chauffage urbain pour exporter la chaleur résiduelle à des fins communautaires. Ces projets contribuent non seulement à réduire les empreintes carbone opérationnelles, mais offrent également de nouvelles voies pour des bénéfices économiques grâce à la réutilisation de l’énergie.

Conclusion

L’évolution des centres de données à l’ère de l’IA nécessite un engagement envers la durabilité et l’efficacité. Passer à un refroidissement centré sur les liquides et des architectures modulaires répond non seulement aux exigences des charges de travail IA à haute densité mais ouvre également la voie à des opérations de centres de données plus durables. Alors que les réglementations se durcissent et que les ressources deviennent plus rares, la poussée de l’industrie vers des solutions innovantes en matière de refroidissement, de distribution d’énergie et de conception modulaire sera essentielle pour atteindre les objectifs de durabilité futurs et soutenir un paysage technologique en évolution rapide.

Sources

  1. ASHRAE Datacom Series (incl. Liquid Cooling Guidelines) ASHRAE Datacom Series Cette source fournit des lignes directrices critiques sur le refroidissement par liquide dans les centres de données, soutenant les affirmations des bénéfices d’efficacité énergétique.

  2. Open Compute Project – Advanced Cooling Solutions (ACS) Open Compute Project Cela démontre comment les normes ouvertes favorisent l’interopérabilité et l’efficacité, cruciales dans la conception de centres de données modernes.

  3. Uptime Institute Global Data Center Survey 2023 (PUE trends) Uptime Institute Les moyennes globales de PUE notées dans cette enquête mettent en lumière le besoin de solutions de refroidissement plus efficaces.

  4. GRC – Single-Phase Immersion Cooling Overview GRC Cooling Fournit des aperçus sur les aspects pratiques et les avantages du refroidissement par immersion dans la gestion des densités de calcul élevées.

  5. Meta – Odense Data Center Heat Recovery Meta – Heat Recovery Offre des exemples d’initiatives réussies de réutilisation de la chaleur dans les centres de données, étayant les affirmations concernant les améliorations de durabilité.

Sources & Références

www.ashrae.org
ASHRAE Datacom Series (incl. Liquid Cooling Guidelines) This source provides critical guidelines on liquid cooling in data centers, supporting claims of energy efficiency benefits.
www.opencompute.org
Open Compute Project – Advanced Cooling Solutions (ACS) This demonstrates how open standards foster interoperability and efficiency, crucial in modern data center design.
uptimeinstitute.com
Uptime Institute Global Data Center Survey 2023 (PUE trends) The global PUE averages noted in this survey highlight the need for more efficient cooling solutions.
www.grcooling.com
GRC – Single-Phase Immersion Cooling Overview Provides insights into the practicalities and benefits of immersion cooling in managing high compute densities.
about.fb.com
Meta – Odense Data Center Heat Recovery Offers examples of successful heat reuse initiatives in data centers, underpinning claims about sustainability enhancements.

Advertisement