La génération d’images s’effectue désormais via GPT-4o au lieu de DALL-E.
OpenAI a publié aujourd’hui une mise à jour majeure de l’outil intégré de ChatGPT pour la génération d’images. Récemment, l’entreprise a également lancé un outil de génération de vidéos : Sora.
Adieu Dall-E 3
La génération d’images a été renouvelée dans ChatGPT. OpenAI a remplacé DALL-E 3 par la génération d’images GPT-4o. Cela signifie que la génération s’est considérablement améliorée, car GPT-4o est un grand modèle de langage qui comprend et traite mieux le texte et les images.
Selon OpenAI, GPT-4o peut dessiner vingt éléments différents spécifiés par l’utilisateur. Le modèle affiche désormais clairement même du texte lisible, ce qui était souvent problématique auparavant. Les utilisateurs peuvent également fournir à ChatGPT des images de référence à modifier. Dans un exemple, le modèle peut créer des arrière-plans transparents. Les arrière-plans transparents sont intéressants pour les graphistes afin de combiner des images.

Le Wall Street Journal rapporte qu’OpenAI a entraîné GPT-4o en utilisant des données publiquement disponibles et des actifs sous licence de partenaires tels que Shutterstock. « Nous avons entraîné nos modèles sur la distribution conjointe d’images et de textes en ligne, en apprenant non seulement comment les images se rapportent au langage, mais aussi comment elles se rapportent les unes aux autres », ont écrit des employés d’OpenAI dans un
billet de blog.
Le générateur d’images amélioré est maintenant disponible dans la version gratuite de ChatGPT, ainsi que dans Plus, Pro et Team. OpenAI prévoit également d’apporter cette fonctionnalité aux abonnements Enterprise et éducatifs prochainement.