Le développement du nouveau modèle DeepSeek ne se déroule pas sans heurts. Le modèle est entraîné sur des puces Huawei Ascend qui ne se montrent pas fiables.
Au début de l’année, DeepSeek a surpris le monde avec le modèle d’efficacité R1, mais son successeur, le R2, se fait attendre. Des difficultés rencontrées lors de la phase d’entraînement ont contraint DeepSeek à reporter la sortie du modèle. Sous la pression du gouvernement chinois, DeepSeek utilise des puces Huawei, mais celles-ci font défaut.
DeepSeek R2 aurait dû voir le jour au printemps. Le lancement a été reporté car l’entreprise chinoise avait du mal à se procurer du matériel Nvidia puissant en raison des restrictions à l’exportation. DeepSeek est passé à Huawei par nécessité.
Puces défaillantes
L’entraînement sur les GPU Huawei Ascend s’est toutefois avéré difficile, confirment plusieurs sources à ArsTechnica. DeepSeek a eu du mal à exécuter des cycles d’entraînement stables sur les puces. À tel point que DeepSeek continue de rechercher activement des puces Nvidia pour l’entraînement et ne souhaite faire fonctionner l’inférence que sur des équipements Huawei.
Le gouvernement chinois s’immisce toutefois dans les affaires et souhaite que les entreprises technologiques chinoises n’achètent plus de puces auprès d’entreprises américaines. Huawei a envoyé une équipe d’intervention sur place pour résoudre le problème. Les médias chinois restent convaincus que le lancement de DeepSeek R2 ne se fera plus attendre très longtemps.
Pris entre deux feux
Les difficultés de DeepSeek illustrent la position des acteurs technologiques chinois, qui sont pris entre deux feux. En raison des restrictions à l’exportation, ils ont du mal à accéder à la technologie des puces étrangères, mais il faut pour l’instant attendre une première « puce miracle » chinoise.
Non seulement les puces chinoises sont moins puissantes que ce que Nvidia a à offrir, mais elles ne prennent pas non plus en charge l’écosystème Cuda, l’arme secrète de Nvidia. Une stratégie « les puces maison d’abord » n’est donc pas intéressante pour une entreprise comme DeepSeek qui veut jouer un rôle sur la scène mondiale de l’IA. Nvidia ne veut pas non plus abandonner le marché chinois et a fait une « offrande de réconciliation » au gouvernement américain.
Le nouveau modèle risque de perdre de sa pertinence par rapport aux nouveaux modèles tels que GPT-5. Une difficulté supplémentaire pour DeepSeek est qu’il est mal vu par les autorités européennes.
lire aussi