DeepSeek R1 offre des performances de pointe à faible coût

argent ai

Le modèle d’IA Deepseek R1 est censé offrir de puissantes performances pour seulement trois à cinq pour cent du coût des modèles d’OpenAI.

Deepseek a amené la communauté de l’IA à repenser ses stratégies et ce qu’il faut faire pour obtenir des performances avancées en matière d’IA. Le modèle open source rivalise avec les performances de l’o1 d’OpenAI pour seulement trois à cinq pour cent du coût, selon VentureBeat. Les investissements des grands acteurs de l’IA sont-ils donc nécessaires ?

Loin d’être leader sur le marché, mais pionnier

Le modèle a été lancé lundi et est immédiatement devenu le modèle le plus tendance sur HuggingFace, avec 131 000 téléchargements à l’heure où nous écrivons ces lignes. Les développeurs veulent savoir ce que le modèle signifie pour leur développement d’IA. La fonction de recherche de DeepSeek qui l’accompagne fonctionnerait mieux que celles d’OpenAI et de Perplexity, et ne serait égalée que par Gemini Deep Research de Google.

Ce qui rend DeepSeek unique, c’est qu’il met l’accent sur l’apprentissage par renforcement (RL) plutôt que sur le réglage fin supervisé (SFT) couramment utilisé. En contournant ce processus, DeepSeek a créé un modèle qui raisonne de manière autonome et donne la priorité à des problèmes plus complexes. Deepseek aurait atteint cette performance avec un budget de 5,58 millions de dollars, ce qui est largement inférieur aux millions investis par OpenAI et Meta.

Son faible coût et son accès libre font du modèle R1 une alternative parfaite aux modèles concurrents plus coûteux. La diffusion du modèle avancé pourrait conduire à une démocratisation, en permettant effectivement aux petites organisations d’être compétitives.