Google présente Project Genie, un nouvel outil d’IA qui permet aux utilisateurs de créer des environnements tridimensionnels interactifs à l’aide de simples instructions textuelles.
Google a lancé un prototype de recherche expérimental, appelé Project Genie, qui permet aux utilisateurs de générer des mondes virtuels via des invites.
Genie 3
L’outil fonctionne avec Genie 3, un modèle de monde que Google a présenté l’année dernière. Il permet de générer des environnements virtuels en temps réel avec une résolution allant jusqu’à 1280×720 pixels et un maximum de 24 images par seconde. Les utilisateurs peuvent naviguer dans un monde généré jusqu’à 60 secondes par session, bien que la technologie sous-jacente puisse prendre en charge des interactions plus longues.
Les utilisateurs décrivent à l’aide de deux champs de saisie à la fois l’environnement et le personnage qui se déplace dans le monde. Le point de vue de la caméra et le style visuel sont également réglables. Project Genie crée d’abord un croquis visuel à l’aide du Nano Banana Pro-model de Google, après quoi l’environnement peut être affiné davantage avec des invites supplémentaires ou des modèles prédéfinis.
Construire des mondes avec du texte et des croquis
Les interactions peuvent être enregistrées sous forme de vidéo, ce qui rend Project Genie intéressant pour la création de contenu et le prototypage. Google y voit également un potentiel pour la formation à l’IA, car les environnements virtuels générés peuvent servir de données visuelles synthétiques. L’entreprise étudie la possibilité de rendre Project Genie disponible aux développeurs via une API à l’avenir.
Project Genie est initialement disponible aux États-Unis pour les abonnés de Google AI Ultra, l’abonnement de 250 dollars par mois. Ce forfait offre des limites d’IA plus élevées, 30 To de stockage dans le cloud et un accès à des outils de développement plus rapides, notamment l’agent de codage Antigravity de Google. Google écrit que le déploiement international suivra plus tard.
