OpenAI publie son nouveau générateur d’images Dall-E 3 dans ChatGPT. L’IA peut générer des images plus belles et plus détaillées que son prédécesseur.
OpenAI ouvre les portes de Dall-E 3 à un plus large public. Le modèle d’IA apparaît dans ChatGPT, mais seuls les utilisateurs payants peuvent l’utiliser pour l’instant. Il faut être abonné à ChatGPT Plus ou ChatGPT Enterprise.
Dall-E 3 est un générateur d’images basé sur l’IA générative. En lançant Dall-E, OpenAI a impressionné le monde entier. Quelques mois plus tard, ChatGPT bouleversait encore plus le monde. Tout comme ses prédécesseurs, Dall-E 3 comprend les descriptions d’images et les utilise pour générer des dessins. OpenAI a lancé le générateur d’images le mois dernier.
Améliorations et limites
La résolution de ces images reste limitée à 1 024 x 1 024 pixels, même dans cette troisième version de l’IA. Mais il y a des améliorations sur d’autres points. Par exemple, Dall-E 3 comprend des questions plus complexes et les images sont plus détaillées. Dall-E 2 avait quelques problèmes, notamment avec les parties du corps des personnes ou des animaux. Cette troisième version résout beaucoup mieux ce problème.
Toutes les images générées avec Dall-E 3 via ChatGPT sont ouvertes au public. On peut donc en faire ce que l’on veut. En outre, OpenAI explique qu’elle a intégré une meilleure protection contre les contenus nuisibles. En ce qui concerne la protection des droits d’auteur, OpenAI fait un rappel en rendant impossible la demande d’une image dans le style d’un artiste encore vivant.
Au travail
Pour commencer à utiliser Dall-E 3, sélectionnez le générateur d’images en haut de la page quand vous commencez une nouvelle conversation.
Ensuite, les possibilités sont illimitées. Il faut être très précis : l’une des qualités de Dall-E 3 est justement de pouvoir répondre à des demandes détaillées et concrètes. N’hésitez donc pas à décrire en détail ce que vous voulez. ChatGPT comprend d’autres langues, mais les messages sont traduits en anglais pour Dall-E.
Lors de nos tests, on constate que les choses se sont beaucoup améliorées, même si les images ne sont pas encore parfaites. Les pieds et les escaliers posent un défi, et nous nous demandons où se trouve la deuxième jambe de la dame sur la gauche. Néanmoins, les visages, les bras et même les mains sont beaucoup plus réalistes que dans les itérations précédentes. Pour cette impression, nous avons demandé une image d’un humain avec un visage de chat dans les escaliers du métro londonien.
Pour cette deuxième impression, nous avons spécifiquement demandé un spectacle de mime d’homme-chat avec des spectateurs qui applaudissent, dans une rue ensoleillée de Paris. Là encore, certains ont des mains plus ou moins foulées, mais l’ensemble est beaucoup plus réaliste. En cliquant sur une image, on obtient immédiatement une description de Dall-E 3, qui sert en quelque sorte de justification de l’œuvre et de son rapport avec votre invite.
Enfin, on a pensé à l’ambiance. Une fois de plus, c’est un chat au centre de l’attention. Cette fois-ci, on voulait qu’il crache du feu sur un immeuble de New York alors qu’il pleuve la nuit. Notez les détails comme le reflet de la flamme sur le chat et le bâtiment.
Dall-E 3 n’existe que depuis peu et le modèle a beaucoup d’utilisateurs curieux. Il prend donc un peu de temps pour que le générateur d’images convertisse votre demande en une impression. Lors de nos tests, il fallait compter au moins 30 secondes d’attente. De plus, le bouton situé en haut de la page pour télécharger l’image ne marchait pas toujours immédiatement.