AWS présente le projet Rainer : un cluster HPC conçu pour Anthropic

AWS présente le projet Rainer à Re:Invent. Il s’agit d’un cluster HPC pour les charges de travail d’IA construit à partir de puces propriétaires. Le système devrait aider Anthropic, concurrent d’OpenAI, à développer des modèles.

À l’occasion de Re:Invent à Las Vegas, AWS présente le projet Rainer au grand public. Le projet Rainer est un supercluster HPC construit à partir de centaines de milliers de puces Trainium 2 développées par l’entreprise elle-même. Le nom original de ces composants indique déjà qu’ils sont destinés à des charges de travail d’entraînement à l’IA.

Le projet Rainer est divisé en Trn2 Ultraservers. Il s’agit de serveurs composés de 64 puces Trainium 2. Chaque puce dispose de 96 gigaoctets de mémoire HBM et de huit NeuronCores. Ensemble, ces éléments permettent à un Ultraserver d’apporter 332 pétaflops de puissance de calcul FP8 sur le champ de bataille.

AWS copie virtuellement les Ultraservers. Le matériel du supercluster du projet Rainer est réparti dans des centres de données situés à différents endroits. AWS veut ainsi garantir qu’il y a suffisamment d’énergie en stock pour alimenter l’ensemble.

Temps de latence plus élevé

D’un autre côté, le projet Rainer n’offre pas une latence spectaculairement faible. Le fournisseur de services en nuage a développé une technologie de réseau propriétaire appelée Elastic Fabric Adapter pour compenser quelque peu cet inconvénient. Elastic Fabric Adapter garantit que le trafic de données ne passe pas par le système d’exploitation, ce qui améliore la vitesse de communication globale dans le cluster.

Le projet Rainer n’est pas encore terminé. AWS prévoit d’achever le cluster l’année prochaine. À ce moment-là, le cluster HPC deviendra le plus grand au monde pour l’entraînement des modèles d’IA. Anthropic, le concurrent d’OpenAI, pourra alors l’utiliser. L’entreprise disposera ainsi de cinq fois plus de puissance de calcul qu’aujourd’hui pour élaborer ses modèles.

AWS investit massivement dans Anthropic, cherchant à contrebalancer le tandem Microsoft-OpenAI avec le partenariat. Microsoft soutient également OpenAI avec la monétisation et la puissance de calcul par force brute dans Azure.

bulletin

Abonnez-vous gratuitement à ITdaily !

  • This field is for validation purposes and should be left unchanged.