La technologie derrière le générateur d’images amélioré d’OpenAI est désormais disponible pour les développeurs.
OpenAI a mis la technologie à disposition mercredi via l’API de ChatGPT. À partir de maintenant, les développeurs peuvent l’intégrer dans leurs applications, écrit OpenAI dans une annonce.
Technologie populaire
La génération d’images améliorée est devenue virale et plus de 130 millions d’utilisateurs de ChatGPT ont généré 700 millions d’images rien que dans la première semaine. Cela a fortement sollicité la capacité des serveurs et une limite a rapidement été imposée.
La génération d’images est alimentée par un modèle d’IA multimodal appelé ‘gpt-image-1’. Ce modèle est maintenant disponible pour les développeurs via l’API. Ils peuvent générer plusieurs images simultanément et déterminer la qualité et la vitesse. OpenAI affirme que les mêmes mesures de sécurité que pour ChatGPT sont appliquées. La différence est que les développeurs peuvent définir la sensibilité de la modération : ‘auto’ pour le filtrage standard ou ‘bas’ pour moins de restrictions.

Pour le texte, vous payez cinq dollars par million de tokens d’entrée. Si vous partagez des images de référence, cela coûte dix dollars par million de tokens d’entrée et pour les images générées, vous payez 40 dollars par million de tokens d’entrée. Cela revient à 2 centimes (qualité basse), 7 centimes (qualité moyenne) et 19 centimes (haute qualité) par image carrée générée.
Selon OpenAI, des entreprises comme Adobe, Instacart, Canva, Figma et Wix expérimentent déjà la technologie. Les utilisateurs de la plateforme Figma Design peuvent générer et éditer des images, Instacart teste le modèle pour des photos de recettes et de listes de courses.
lire aussi