Eau chaude, serveurs froids : les puces Blackwell de Nvidia comme chauffages de piscine

Selon Lenovo, l’eau chaude est la solution pour maintenir les serveurs au frais. Avec quelques innovations astucieuses, le fabricant vise à rendre le refroidissement par eau largement accessible. Le calcul intensif et l’intelligence artificielle sont les premières cibles, mais à terme, tout le monde peut en bénéficier. La clé : une solution qui s’adapte aux centres de données existants.

Le refroidissement par air des serveurs atteint ses limites. C’est ce qu’affirme Scott Tease, vice-président de WW High-Performance Computing and AI Intelligence chez Lenovo, dans une interview accordée à ITdaily lors du salon Tech World à Bellevue. « Toute l’énergie que vous injectez dans un serveur le quitte sous forme de chaleur », explique-t-il.

« Si votre serveur consomme 10 kilowatts d’énergie, vous devez éliminer 10 kilowatts de chaleur », poursuit-il. « Cela se fait généralement par climatisation, mais si vous voulez vous débarrasser de 10 kW, vous avez besoin d’environ 4 kW de refroidissement.

Si vous voulez vous débarrasser de 10 kW de chaleur, vous avez besoin d’environ 4 kW de refroidissement.

Scott Tease, vice-président de WW High-Performance Computing and AI Intelligence, Lenovo

Ce n’est pas efficace, mais cela fonctionne. « Même les serveurs HPC d’une consommation de 25 kW peuvent être refroidis à l’air », admet Tease. Lenovo propose elle-même de telles solutions et les expose à Tech World. Les serveurs HPC refroidis par air sont certes énormes et pèsent lourd. Les immenses radiateurs y sont pour beaucoup.

Aujourd’hui, il est possible de refroidir les serveurs AI avec de l’air, mais les énormes radiateurs occupent beaucoup d’espace. En outre, les serveurs sont extrêmement lourds, de sorte qu’un rack doit bientôt être placé sur une surface renforcée.

Limite du refroidissement par air

Les serveurs devenant de plus en plus puissants, l’option du refroidissement par air disparaîtra. « Vous ne pouvez tout simplement pas refroidir 100 kW avec de l’air », déclare Tease. La solution : le refroidissement par eau.

Vous ne pouvez tout simplement pas refroidir 100 kW avec de l’air

Scott Tease, vice-président de WW High-Performance Computing and AI Intelligence, Lenovo

Lenovo n’est pas le seul à l’avoir compris. « Dell et HP construisent également des solutions puissantes », explique M. Tease. « Mais leurs racks sont énormes. Ils mesurent 2,5 mètres de profondeur, ne passent pas par une porte et n’entrent pas dans un ascenseur, et les clients doivent renforcer le sol de leur centre de données pour les installer.

Problème d’accessibilité

L’astuce consiste donc à refroidir des serveurs puissants d’une manière plus accessible. « Nos serveurs refroidis à l’eau sont également un peu plus larges et plus hauts qu’un serveur rack standard », explique M. Tease. En d’autres termes, ils ne tiennent pas non plus dans un rack standard.

« Nous avons lancé ce défi à l’équipe d’ingénieurs », poursuit-il. « Comment pouvons-nous encore faire entrer ces serveurs surdimensionnés dans un rack standard de 19 pouces ? À Tech World, Lenovo présente la solution à ce problème.

Le châssis N1380 de Lenovo s’insère dans un rack de 19 pouces et accueille des serveurs refroidis à l’eau installés verticalement.

Le fabricant présente le châssis N1380. Il s’agit d’un grand boîtier dans lequel les clients peuvent ranger verticalement des serveurs HPC. Le châssis N1380 héberge les serveurs verticalement et tient lui-même dans un rack classique de 19 pouces. Le châssis est également équipé d’unitésde distribution d’énergie (PDU). Un rack peut accueillir trois boîtiers N1380. Lenovo ouvre ainsi la porte à des racks d’une capacité de plus de 100 kW, sans qu’il soit nécessaire de procéder à des modifications drastiques au sein du centre de données.

Eau chaude

Le système de refroidissement liquide Neptune fonctionne avec de l’eau non refroidie à température ambiante. « L’eau qui entre dans le serveur peut avoir une température de 45 °C », explique M. Tease. Le résultat est une eau d’environ 55 °C. Tease : « De cette manière, nous n’avons pas besoin d’investir de l’énergie dans le refroidissement de l’eau elle-même ».

Avec ces tolérances de température, le système de refroidissement liquide Neptune de sixième génération est en principe capable de rafraîchir la plupart des centres de données en Europe et aux États-Unis, sans traitement spécial de l’eau au préalable.

Lenovo est en mesure d’offrir cette technologie relativement unique grâce à des années de recherche. Ces recherches ont en fait débuté à l’époque d’IBM et sont basées sur les connaissances acquises dans le secteur des ordinateurs centraux. « Lorsque vous regardez les premières solutions conçues autour de 2010, vous pouvez voir que Neptune est toujours basé sur cela aujourd’hui », déclare Tease. « De grands tubes, un minimum de connecteurs, un faible débit et une faible pression : la solution suit toujours les mêmes principes. »

Lenovo développe Neptune entièrement en interne, en veillant à ce que l’eau dissipe la chaleur directement à partir de la puce pour une efficacité maximale. Ce serveur est équipé de deux superpuces Nvidia Blackwell, sur chacune desquelles les complexes GPU et CPU sont directement refroidis.

Lenovo développe ses serveurs refroidis à l’eau entièrement en interne, en commençant par la carte mère. Selon M. Tease, c’est la clé de l’efficacité, qui permet à son tour le refroidissement par eau chaude.

Chauffage de la piscine

Il est évident que les utilisateurs devront connecter le système de refroidissement liquide, mais M. Tease estime que ce n’est pas un problème majeur. Lenovo a déjà beaucoup d’expérience dans l’intégration du refroidissement par eau dans les centres de données de ses clients, initialement conçus pour le refroidissement par air.

Tease espère que les clients utiliseront la chaleur résiduelle à l’avenir, par exemple pour chauffer des bâtiments. Il ne s’agit pas d’une idée théorique : dans son usine en Hongrie, Lenovo chauffe déjà des salles de réunion avec l’eau chaude de ses serveurs d’essai Neptune.

lire aussi

Eau chaude, serveurs froids : les puces Blackwell de Nvidia comme chauffages de piscine

« Vous pouvez simplement connecter les tuyaux d’eau de Neptune à des tuyaux et pomper l’eau vers un autre endroit », explique-t-il. « Pensez à une université, par exemple, où l’eau chaude du centre de données peut réchauffer l’eau de la piscine par le biais d’un échangeur de chaleur. L’eau chaude n’est donc plus un déchet, mais peut être recyclée à des fins d’économie d’énergie. »

Faible PUE

L’intégration du refroidissement par eau permet également de réaliser de nombreuses économies. « Tout commence par les ventilateurs », explique M. Tease. « Les ventilateurs sont responsables de 10 à 15 % de la consommation d’énergie des serveurs refroidis par air. Il faut beaucoup d’énergie pour déplacer l’air ».

Les serveurs refroidis par Neptune n’ont plus besoin de ventilateurs et, comme le refroidissement par eau élimine toute la chaleur résiduelle des serveurs, le centre de données n’a pas non plus besoin d’être climatisé.

« C’est ainsi que nous économisons une énorme quantité d’énergie », explique M. Tease. « Un centre de données refroidi par air a généralement une efficacité d’utilisation de l’énergie (PUE) de 1,4 ou 1,6, ce qui signifie que 40 à 60 % de l’énergie n’est pas utilisée pour les serveurs, mais pour le refroidissement. Avec Neptune, le PUE tombe en dessous de 1,1. Un PUE de 1,07 est facilement réalisable.

En d’autres termes, le refroidissement par eau permet d’économiser jusqu’à 40 % d’énergie par rapport aux mêmes charges de travail supportées par un refroidissement par air.

L’IA a vraiment accéléré l’intérêt pour le refroidissement par eau.

Scott Tease, vice-président de WW High-Performance Computing and AI Intelligence, Lenovo

« Nous avons initialement développé la technologie pour les clients HPC », explique M. Tease. « Mais c’est l’IA qui en sera le plus grand bénéficiaire. L’IA a vraiment accéléré l’intérêt pour le refroidissement par eau. »

Également pour les entreprises ?

Les chiffres de Tease screens with semblent intéressants en dehors des charges de travail liées à l’IA et au HPC. Les serveurs plus classiques peuvent également bénéficier du refroidissement par eau. Un PUE plus faible signifie un impact environnemental plus faible et un coût d’exploitation plus bas.

« Il y a effectivement plus d’intérêt que jamais », convient M. Tease, « mais il n’est pas encore aussi fort en dehors du HPC et de l’IA. Avec les objectifs de durabilité et les objectifs ESG, il y a plus de facteurs de motivation que jamais pour adopter le refroidissement par eau, mais nous ne voyons pas encore un grand élan dans le segment des entreprises. Pas encore, mais cela finira par arriver. »

Serveur sexy

À Tech World, Lenovo présente le tout nouveau SC777 : un serveur IA refroidi par eau Neptune et équipé de deux superpuces Nvidia GB200 Blackwell. Le PDG Yuanqing Yan présente le serveur avec le patron de Nvidia, Jensen Huang, sur la scène. « N’est-ce pas merveilleux ? », a déclaré Huang lors de la présentation. « Pour un ingénieur, cet appareil est sexy.

Pour un ingénieur, cet appareil est sexy.

Jensen Huang, PDG de Nvidia
Jensen Huang, PDG de Nvidia, qualifie de sexy la Lenovo SC777 refroidie à l’eau.

« Ce SC777 consomme 15 fois plus d’énergie que les premiers nœuds que nous avons refroidis avec Neptune il y a une quinzaine d’années », ajoute M. Tease. « Cela semble beaucoup, mais chaque SC777 est environ mille fois plus performant que les serveurs de l’époque. Les appareils consomment plus, mais les performances par watt se sont améliorées de manière exponentielle.

Relativement accessible

Neptune et le châssis N1380 rendent le SC777 relativement accessible. Les clients peuvent fournir des racks classiques de serveurs AI, dans un centre de données classique, grâce à Neptune. Bien sûr, cela ne veut pas dire que tout le monde peut soudainement installer des serveurs Blackwell AI, si l’on fait abstraction du prix.

lire aussi

Eau chaude, serveurs froids : les puces Blackwell de Nvidia comme chauffages de piscine

Tease : « Pendant longtemps, le facteur limitant le déploiement d’une puissance de calcul suffisante était le budget et le nombre de cœurs de calcul. Aujourd’hui, c’est en fait la puissance disponible. » Lenovo ne peut pas injecter plus de puissance dans le réseau. Les solutions Neptune accessibles devraient toutefois garantir que l’énergie disponible pour une organisation soit autant que possible affectée au matériel informatique et non au refroidissement.

Sauce secrète

Tease est convaincu que c’est la raison pour laquelle Neptune donne un avantage à Lenovo. « D’autres fabricants peuvent probablement copier notre solution, s’ils le veulent vraiment », soupçonne-t-il. « Mais ils n’ont pas notre expérience en matière de conversion de centres de données classiques au refroidissement par eau. Cette expérience est notre recette secrète.

bulletin

Abonnez-vous gratuitement à ITdaily !

  • This field is for validation purposes and should be left unchanged.