Google Labs teste un nouveau générateur d’images appelé Whisk. Il permet de combiner trois images en une seule : une pour le sujet, une pour le style et une pour la scène.
Google Labs expérimente un nouveau générateur d’images, Whisk, qui combine trois images en une seule. Pour ce faire, Google utilise le modèle de génération d’images Imagen 3, comme il l’a fait précédemment avec son générateur de vidéos Veo et dans Google Docs.
La créativité sous un nouveau jour
Les utilisateurs peuvent télécharger une image pour le sujet, une autre pour la scène et une autre pour le style. Vous pouvez ainsi sélectionner une photo de vous comme sujet, un paysage ensoleillé comme scène et une aquarelle comme style final. Enfin, ajoutez une invite textuelle pour clarifier les détails de l’image générée.
Le modèle génère automatiquement une légende pour la photo, qui peut être modifiée pour souligner davantage l’aspect souhaité. Google précise dans un blog que Whisk ne se concentre que sur certaines caractéristiques clés de la photo. Le résultat peut donc différer de ce qui est attendu. Ainsi, le sujet peut avoir une taille, des cheveux ou une couleur de peau différents. Vous pouvez toutefois mettre à jour l’invite de texte par la suite.
Pour l’instant, Whisk n’est disponible qu’aux États-Unis. Le géant de la technologie ne précise pas pour l’instant quand l’Europe pourra l’utiliser.
lire aussi