GPT-5 est disponible pour tous les utilisateurs de ChatGPT depuis la fin de la semaine dernière. Que propose le dernier modèle d’OpenAI ? Nous le comparons à son prédécesseur GPT-4o.
OpenAI a annoncé en grande pompe le très attendu modèle GPT-5 la semaine dernière. Le nouveau modèle de langage doit fournir des réponses plus précises et mieux gérer les questions complexes que la génération précédente. OpenAI a une grande confiance en GPT-5 et en a fait immédiatement l’option par défaut pour ChatGPT.
Les premières réactions à GPT-5 sont mitigées. Les utilisateurs ont dû s’adapter au nouveau style de conversation de ChatGPT. À la demande des utilisateurs, OpenAI a donc réintroduit GPT-4o : un simple clic permet de basculer entre les différentes versions. L’occasion idéale pour nous de comparer les deux modèles.
lire aussi
Comment remplacer GPT-5 par GPT-4o
Un système unifié
Examinons d’abord brièvement ce qui se passe dans le cerveau de GPT-5. GPT-5, comme les versions précédentes, n’est pas un modèle unique. Il y a le « modèle de base » gpt-5-main, gpt-5-thinking pour les prompts nécessitant un raisonnement plus complexe et gpt-5-pro. Ce dernier est réservé par OpenAI aux détenteurs de l’abonnement Pro le plus cher.
Ce qui est unique avec GPT-5, c’est que les modèles sont appelés depuis un système unifié. En principe, vous n’avez pas besoin de sélectionner un modèle dans le menu de ChatGPT. GPT-5 détermine, sur la base de votre prompt, quel modèle est le plus approprié pour y répondre. Ainsi, ChatGPT utilise ses ressources de manière plus économe qu’auparavant.
GPT-5 doit généralement mieux performer que GPT-4o sur diverses tâches et moins halluciner. Sur pratiquement tous les benchmarks partagés par OpenAI lors de l’annonce, le nouveau modèle fait mieux. Ce que vous remarquerez peut-être plus rapidement en tant qu’utilisateur, c’est que GPT-5 adopte un style différent. GPT-4 est connu comme un béni-oui-oui soumis, tandis que GPT-5 se positionne davantage comme un partenaire de réflexion qui ose aussi être en désaccord.
GPT-5 vs GPT-4 : une comparaison
Nous comparons GPT-5 et GPT-4o à travers quelques tests. Les tests évaluent différentes compétences, dont le raisonnement. Les deux modèles reçoivent des prompts identiques. Nous effectuons le test avec des prompts en anglais, mais vous pouvez reproduire ce test dans la langue de votre choix.
Universitaire
Le PDG d’OpenAI Sam Altman décrit GPT-5 comme un « doctorant », nous demandons donc d’abord à ChatGPT d’expliquer le fonctionnement des ordinateurs quantiques au niveau académique. GPT-5 se met dans la peau d’un universitaire et explique la structure. GPT-4 manque une conclusion claire qui résume l’essentiel.


Dans un prompt de suivi, nous demandons aux modèles d’expliquer les ordinateurs quantiques comme s’ils s’adressaient à une classe maternelle et d’utiliser une représentation visuelle. GPT-5 comprend qu’un jeune public a plus besoin d’une image claire que d’une longue explication. GPT-4o est son moi surexcité habituel, mais l’explication contient peu ou pas de support visuel et ferait rapidement décrocher un groupe de bambins.


Penser par étapes
Dans un test suivant, nous examinons les capacités de raisonnement. Les deux modèles sont entraînés à « penser » en plusieurs étapes, ce qui permet de poser des questions complexes. GPT-5 vous montre le processus de raisonnement et sort même le chronomètre.
Comme premier exemple, nous demandons d’établir un plan d’entraînement et un régime alimentaire. La personne fictive n’a pas d’expérience en course à pied et a de mauvais genoux, mais souhaite courir un marathon dans exactement un an. Pour compliquer le régime alimentaire, la personne est sans gluten et exclusivement végétalienne.
Les deux modèles divisent le programme d’entraînement en quatre phases pour progresser étape par étape vers un marathon. Les deux régimes alimentaires sont également divisés selon un programme quotidien et des suppléments optionnels qui peuvent être pris. GPT-5 obtient un léger avantage car il donne des conseils supplémentaires pour protéger les genoux fragiles, un aspect que GPT-4 avait quelque peu négligé.


Après l’effort vient le réconfort. Maintenant, nous demandons à ChatGPT de nous aider avec nos plans de voyage. Nous testons deux scénarios. D’abord, nous voulons voyager en Australie. Nous demandons un itinéraire avec quelques lieux que nous voulons absolument voir. C’est à ChatGPT de déterminer la meilleure période de voyage, de chercher les meilleurs prix et de tracer l’itinéraire efficacement.
Encore une fois, nous obtenons deux aperçus détaillés. GPT-5 et GPT-4 choisissent tous deux le mois de septembre comme période idéale de voyage et arrivent à un planning journalier plus ou moins similaire pour trois semaines. Le plan de voyage de GPT-5 est plus détaillé avec des conseils sur la façon de trouver les meilleurs prix pour les vols et l’hébergement.


Maintenant, nous restons plus près de chez nous et voulons conduire une voiture électrique de Bruxelles à Athènes. Nous demandons à ChatGPT de concevoir une carte et de marquer où nous devrions recharger, en fonction de l’autonomie de la voiture. GPT-5 joue la sécurité et propose 11 arrêts intermédiaires. GPT-4o pense pouvoir le faire en neuf étapes, mais propose des distances que la voiture ne peut pas parcourir sans recharge. GPT-5 rend l’itinéraire plus visuel que GPT-4.


Mathématiques et codage
Du raisonnement, nous passons aux mathématiques. Nous faisons résoudre à GPT-5 et GPT-4o une équation mathématique complexe et montrer les étapes intermédiaires, comme dans un test de mathématiques. Les deux modèles arrivent à la solution correcte, mais GPT-5 nécessite moins d’étapes intermédiaires. Nous observons la même chose avec une énigme mathématique où les modèles doivent chercher un nombre. GPT-4 doit « essayer » plus de nombres que GPT-5 pour trouver la solution.


GPT-5 devrait être meilleur en codage, nous testons donc cela avec une tâche de codage simple. Celle-ci implique l’écriture d’un script PowerShell pour vérifier l’espace disque. Les deux modèles fournissent un script prêt à l’emploi qu’il suffit de copier-coller. GPT-5 se distingue dans ce test en fournissant également un guide pour exécuter le script avec le Bloc-notes et PowerShell.
Écriture créative
Enfin, nous laissons les modèles s’exprimer créativement. Nous demandons à GPT-5 et GPT-4o d’écrire une déclaration d’amour à ITdaily. D’abord, les modèles ont une liberté totale, puis ils doivent obligatoirement composer un acrostiche qui épelle « ITdaily » avec les premières lettres de chaque phrase. GPT-5 montre son côté créatif, mais GPT-4 y met un peu plus de cœur et d’âme.


Dans une dernière expérience, nous explorons plus en profondeur l’« intelligence émotionnelle » des modèles. Nous demandons aux modèles comment ils consoleraient un ami dont la grand-mère vient de décéder. GPT-5 aborde cela de manière analytique et donne cinq conseils pratiques pour gérer cette situation. Écrire un message de réconfort n’est pas la spécialité de GPT-5 : c’est toujours mieux de le faire soi-même.
Verdict final
Dans la plupart des tests, GPT-5 sort vainqueur pour nous. Le nouveau modèle donne des réponses plus détaillées et structurées et nous fait participer à son raisonnement. GPT-5 réussit également mieux à rendre la sortie visuelle. Le ton « professionnel » semble plus distant, mais plus réaliste que l’enthousiasme parfois excessif de GPT-4. Un assistant IA qui se positionne comme un partenaire de réflexion est plus utile qu’une IA qui essaie d’être votre ami.