OpenAI dévoile le modèle d’IA o1 : « Réfléchit avant de répondre »

Le mystérieux projet « Strawberry » de l’OpenAI révèle ses secrets. OpenAI o1 est le dernier modèle d’IA qui excelle dans les tâches de raisonnement.

Ces derniers jours, de nombreuses rumeurs ont circulé sur le « projet secret » d’OpenAI appelé Strawberry. L’entreprise lance aujourd’hui le nouveau modèle qui se cache derrière ce projet : OpenAI o1. Ce modèle répondrait plus lentement que, par exemple, ChatGPT-4o. En effet, le modèle réfléchit d’abord et passe par un processus de raisonnement complet avant de fournir une réponse. Il est donc adapté à la résolution de tâches mathématiques complexes. OpenAI o1 apparaît en préversion pour les utilisateurs de ChatGPT-Plus.

« Réfléchit avant de répondre »

Le nouveau modèle o1 d’OpenAI réfléchit avant de répondre. C’est ainsi qu’OpenAI présente son nouveau membre. Le modèle répondra donc beaucoup plus lentement que le ChatGPT-4o, mais OpenAI explique cela par le fait que le chatbot vérifiera mieux si ce qu’il dit est vrai.

OpenAI utilise ce que l’on appelle la chaîne de pensée, qui est intégrée au modèle. Le modèle se distingue principalement dans les tâches de raisonnement. Parce qu’il écrit d’abord une longue « chaîne de pensée » avant que la réponse ne vienne, le modèle peut proposer plusieurs réponses et donc faire moins d’erreurs. Cela devrait également conduire à moins d’hallucinations.

Dans l’image ci-dessus, on peut voir un exemple du processus de raisonnement de o1. Lorsqu’une question mathématique complexe lui est posée, le modèle prend son temps pour donner une réponse. Cela est d’ailleurs indiqué : le modèle a mis 54 secondes pour le faire. De plus, pendant ce temps, vous pouvez voir à quelle étape du processus de raisonnement le modèle se trouve. Le résultat est un raisonnement étendu qui montre comment le modèle est parvenu à la réponse.

Talent de raisonnement

Le point fort d’OpenAI o1 réside dans ses tâches de raisonnement. Les problèmes complexes peuvent être résolus de manière très efficace. En effet, le test de référence MATH montre qu’o1 obtient un score de 94,8 %. C’est une grande différence par rapport au score de GPT-4o, qui est de 60,3 %. Alors, pour quelles tâches le modèle n’est-il pas adapté ? Le téléchargement de fichiers ou la génération d’images, pour lesquels le GPT-4o est toujours aussi performant. La préversion o1 est disponible dès maintenant, mais uniquement pour les utilisateurs de ChatGPT-Plus.

newsletter

Abonnez-vous gratuitement à ITdaily !

Category(Required)
This field is for validation purposes and should be left unchanged.