OpenAI a annoncé ses nouveaux modèles de raisonnement simulé. Nommés o3 et o3-mini, ils s’appuient sur les modèles précédents o1.
Les nouveaux modèles o3 et o3 d’OpenAI ont été annoncés, mais ne seront pas encore disponibles. Ils seront tout d’abord mis à la disposition du public à des fins de recherche et de test de la sécurité publique.
Raisonnement simulé
Ces modèles s’appuient sur les modèles o1 lancés au début de l’année. Ils utilisent une « chaîne de pensée privée ». Le modèle s’arrête brièvement pour examiner le dialogue interne et planifier sa réponse. Cette forme est appelée « raisonnement simulé », qui surpasse le pouvoir de réflexion des simples LLM. Google lance également son modèle Gemini 2.0 Flash Thinking qui utilise la même méthode de raisonnement simulé.
De manière remarquable, le modèle o3 a obtenu des résultats élevés dans des tests de référence tels que l’ARC-AGI et l’American Invitational Mathematics Exam. Le modèle a obtenu un score de 87,5 % dans les tests de calcul intensif, ce qui est comparable aux performances humaines.
Selon le PDG Sam Altman, le lancement de o3-mini est prévu pour la fin du mois de janvier, suivi du déploiement complet du modèle o3-mini peu de temps après. Le modèle o3-mini comprend une fonction de réflexion adaptative qui offre des vitesses de traitement faibles, moyennes et élevées.
Lire aussi : Le modèle GPT-5 d’OpenAI « semble incapable de répondre aux attentes ».