OpenAI propose deux nouveaux modèles capables de mieux raisonner et d’utiliser simultanément plusieurs outils.
Les nouveaux modèles d’IA multimodaux d’OpenAI s’appellent o3 et o4-mini et seraient « les modèles les plus intelligents jamais créés », selon une annonce. Ils combinent un raisonnement avancé avec des fonctionnalités telles que la navigation et le codage. Ce sont les premiers modèles capables d’utiliser chaque outil de ChatGPT, comme l’analyse visuelle ou la génération d’images.
Raisonnement avec image, code et données
OpenAI qualifie ce nouveau processus de ‘raisonnement simulé’ : un processus de réflexion en plusieurs étapes. La différence entre les modèles réside dans les cas d’utilisation et la vitesse. Selon OpenAI, o3 est conçu pour des analyses complexes et coûte 10 dollars par million de tokens d’entrée. o4-mini serait plus apte à gérer des tâches de moindre envergure, tout en restant suffisamment puissant pour de nombreuses applications.
En outre, OpenAI lance également l’outil de développement Codex CLI. L’application de terminal open source est décrite comme « un agent de codage que l’on peut exécuter localement ». Elle connecte les modèles aux ordinateurs et au code local, permettant ainsi de générer, tester et exécuter du code IA sur son propre ordinateur. Codex CLI ressemble à Claude Code d’Anthropic, mais fonctionne naturellement avec les propres modèles d’OpenAI.
o3 et o4-mini sont désormais disponibles pour les abonnés ChatGPT Plus, Pro et Team. Les utilisateurs de la version gratuite peuvent temporairement tester o4-mini via l’option « Think ». La semaine prochaine, les modèles seront également accessibles aux abonnements Enterprise et éducatifs. Les développeurs peuvent déjà les utiliser dès aujourd’hui via l’API, bien qu’une vérification supplémentaire soit parfois requise.