DeepSeek lance un concurrent de GPT-5, mais le gouvernement fédéral ne peut pas l’utiliser

DeepSeek logo smartphone

DeepSeek lance deux nouveaux modèles d’IA : DeepSeek-V3.2 agit comme un assistant de raisonnement quotidien et DeepSeek-V3.2 Spécial se concentre sur des tâches de raisonnement plus complexes.

La startup chinoise d’IA DeepSeek se présente avec deux nouveaux modèles d’IA. Ceux-ci pourraient bien entrer en concurrence avec le GPT-5 d’OpenAI. Du moins, c’est ce qu’affirme l’entreprise chinoise elle-même. DeepSeek-V3.2 remplace la version V3.2-Exp précédente et est disponible via application, web et API. La variante Spéciale se concentre sur des tâches de raisonnement plus complexes et n’est pour l’instant accessible que via une API temporaire.

Raisonnement IA

Selon DeepSeek, V3.2 offre un équilibre entre capacité de raisonnement, vitesse et longueur de contexte. Le modèle doit se positionner dans la même catégorie que d’autres modèles génératifs de pointe récents.

V3.2-Spécial peut traiter plus de tokens et effectuer des étapes de réflexion plus longues, mais consomme ainsi plus de puissance de calcul par requête. Cette variante ne prend pas en charge les appels d’outils et restera disponible jusqu’à mi-décembre 2025 pour évaluation

Agents

Les modèles ont été développés en vue d’une utilisation dans des environnements d’agents. DeepSeek décrit sa propre méthode de synthèse de données, basée sur plus de 1 800 environnements et environ 85 000 instructions complexes. L’entreprise vise ainsi à former des agents capables de planifier plusieurs étapes, d’utiliser des outils et d’accomplir des tâches de manière autonome.

lire aussi

Le dernier modèle DeepSeek montre un avenir sans CUDA

Un élément notable est l’intégration du ‘mode de réflexion’ dans l’utilisation des outils. Selon la documentation, V3.2 peut appeler des outils à la fois en mode réflexion et dans un mode plus direct. Cela devrait donner aux développeurs plus de contrôle sur la façon dont un agent raisonne, conserve les étapes intermédiaires et justifie ses décisions.

Le rapport technique, disponible via Hugging Face, décrit l’architecture, la stratégie d’entraînement et les résultats des benchmarks. DeepSeek affirme que V3.2-Spécial obtient des résultats de niveau or dans diverses compétitions internationales de programmation et de mathématiques, telles que les benchmarks de type IMO, ICPC et IOI.

Disponible en open source

En plus de l’API commerciale, DeepSeek met également les deux modèles à disposition en open source. DeepSeek-V3.2 et DeepSeek-V3.2-Spécial peuvent être téléchargés via Hugging Face pour une utilisation dans sa propre infrastructure.

Pour les entreprises et les développeurs du Benelux, cela ouvre la porte à des implémentations sur site, des flux de travail d’agents expérimentaux et des personnalisations basées sur les modèles standard.

Pas pour le gouvernement fédéral

Bien que les nouveaux modèles semblent prometteurs, tout le monde ne pourra pas en profiter. À partir du 1er décembre, le personnel du gouvernement fédéral ne sera plus autorisé à utiliser les applications du chinois DeepSeek. Toutes les applications de l’entreprise d’IA devront donc être supprimées par les membres du personnel. Des questions se posent depuis longtemps concernant la confidentialité du modèle, étant donné ses origines chinoises.

lire aussi

Le gouvernement fédéral dit ‘Non’ à DeepSeek : le modèle d’IA chinois est bloqué pour le personnel