Google présente son dernier modèle d’IA Genie 3. Le modèle peut concevoir des mondes interactifs pendant que vous les explorez.
Google a publié une démo de Genie 3, le dernier modèle d’IA issu du laboratoire DeepMind. Le modèle combine la génération précédente de Genie et le générateur de vidéos IA Veo. Genie 3 ne se limite toutefois pas aux courts clips vidéo et peut concevoir et adapter des mondes virtuels en temps réel.
La vidéo de démonstration présentée par Google DeepMind ressemble, hors contexte, à une publicité pour un jeu VR. Genie 3 conçoit des mondes virtuels basés sur des prompts textuels que vous pouvez explorer de manière interactive. Ces simulations en direct peuvent aller du ski en montagne à un voyage dans le temps vers une période historique, en passant par des situations quotidiennes comme peindre sa maison.
« Cela va bien au-delà des modèles limités qui existaient auparavant. Genie 3 n’est pas limité à un environnement particulier. Il peut générer des mondes photoréalistes comme imaginaires, et tout ce qui se trouve entre les deux », déclare le chercheur Deepmind Shlomi Fruchter à TechCrunch.
Monde interactif
Les mondes virtuels se déplacent effectivement avec vous. À chaque pas que vous faites, le modèle étend le monde en temps réel. Les prompts textuels permettent d’indiquer ce que vous souhaitez ajouter au monde ou vers quel environnement vous voulez voyager. Genie 3 mémorise chaque changement et action que vous effectuez, afin qu’ils restent visibles lors de votre retour. Le modèle est conçu pour devoir « regarder en arrière » les étapes précédentes avant de pouvoir générer l’étape suivante.
Genie 3 génère des images avec une résolution de 720p à 24 fps. Les simulations sont encore limitées à quelques minutes, mais cela représente tout de même une avancée par rapport aux modèles actuels de génération d’images.
Move 37
Selon Google, les applications potentielles de Genie 3 sont nombreuses. Pensez aux jeux en réalité virtuelle sans avoir à porter de lunettes spécialisées, mais cela va bien au-delà. Google est convaincu que les simulations seront également utiles pour la recherche scientifique, l’éducation et le développement de jumeaux numériques pour l’agriculture et la production.
Les agents IA sont tendance et Google souligne donc que les entreprises peuvent préparer leurs agents pour le monde réel via Genie 3. Chez DeepMind, on parle même déjà du moment « Move 37 » pour les agents IA, faisant référence à l’époque où un modèle d’IA de Google a battu le champion du monde au jeu de Go.
lire aussi
Sam Altman : « Les agents d’IA deviennent meilleurs que vos employés les plus expérimentés »
Pour l’instant, Google garde Genie 3 à l’abri des regards du grand public. Une version préliminaire est disponible à des fins de recherche. On ne sait pas encore si et quand Genie 3 sera plus largement disponible.