L’une des vidéos de démonstration que Google a partagées pour présenter les possibilités de son dernier modèle Gemini se révèle ne pas être tout à fait authentique.
Mercredi soir, Google a annoncé Gemini, le modèle de langage le plus puissant à ce jour qui est sorti des laboratoires de DeepMind. Avec Gemini, Google souhaite ressaisir le flambeau d’OpenAI dans la course de l’IA. Avec cette annonce, Google a également publié quelques vidéos pour démontrer les capacités multimodales de Gemini.
Une vidéo particulière a attiré l’attention. Un employé de Google y joue à une série de jeux avec Gemini. L’IA passe sans effort du texte à la voix, à l’image et à l’audio, et on a l’impression d’une interaction naturelle entre les humains et l’intelligence artificielle. Mais cette vidéo ne semble pas tout à fait authentique, note Bloomberg.
Édition créative
Dans la description de la vidéo, Google indique en fait déjà qu’elle est créativement éditée. « Pour cette démo, la latence a été réduite et les sorties Gemini raccourcies ». Bref, Google donne l’impression que Gemini répond beaucoup plus rapidement et plus concisément que ce n’est le cas en réalité.
Mais la nature de la conversation a également été modifiée. Google admet à Bloomberg que la démo n’a pas été filmée en temps réel, mais qu’elle a été créée en collant des images fixes, puis en ajoutant des invites textuelles auxquelles Gemini répondait. « C’est très différent de ce que Google laissait entendre. Notammant qu’une personne pouvait avoir une conversation parlée fluide avec Gemini pendant qu’il observait et répondait au monde autour de lui en temps réel », écrit le journaliste Parmy Olson dans l’édito.
Temps réel est rarement temps réel
Google se défend sur les médias sociaux. Orial Vinyals, chercheur chez DeepMind, écrit sur X que toutes les invites et les réponses de Gemini sont 100 % réelles et que la vidéo a été réalisée pour inspirer les développeurs. Et l’édition d’une démo est tout à fait normale. Les démonstrations lors des conférences de presse ou des présentations sont rarement, voire jamais, « en direct » ; les entreprises veulent garder le contrôle de la situation.
Google elle-même connaît cette situation déjà. Le lancement de Bard en février dernier a complètement échoué. Clairement, Google essaie d’être plus prudent. Mais Gemini sentira de plus en plus le besoin de tenir ses promesses.