Google révèle Gemini, son modèle d’IA le plus puissant à ce jour

google gemini
Bron: Google

Gemini de Google aura plusieurs visages et devrait rivaliser avec GPT-4. Google veut ainsi démontrer que c’est absolument seulement elle qui sait gérer l’IA.

Sundar Pichai (le PDG de Google) et Demis Hassabis (le PDG de Deepmind) sont fiers de présenter Gemini. Gemini est le nouveau LLM ultramoderne qui sort des laboratoires de Deepmind. Il y a quelques jours, il semblait que la sortie de Gemini n’était pas prévue avant 2024, mais Google n’a finalement pas pu attendre pour l’annoncer. Avec Gemini, Google veut à nouveau montrer au monde que le but principal de l’entreprise est l’IA, une réputation déjà un peu ternie depuis le lancement de ChatGPT. Gemini aura trois visages : Ultra, Pro et Nano.

Google n’hésite pas à faire des comparaisons avec GPT-4. On lit dans un blog 32 points de référence dont Gemini Ultra surpasse la concurrence sur trente d’entre eux. Gemini Ultra aurait également obtenu un score de quatre-vingt-dix pour cent lors de tests multitâches combinant plusieurs sujets. Cela fait de Gemini le premier modèle d’IA à obtenir un meilleur score que les experts humains sur ces tests. Le modèle d’IA est aussi capable de raisonnements plus complexes.

Pour former Gemini, Google a aussi développé une TPU de nouvelle génération à utiliser dans ses centres de données : Cloud TPU v5p. Malgré les capacités étendues, les applications construites sur les modèles Gemini pouvaient s’exécuter plus rapidement que leurs homologues moins « lourds ».

Mise à niveau majeure pour Bard

C’est une belle théorie, mais comment la mettre en pratique ? La plèbe rencontra généralement Gemini Pro. Google veut déployer la variante intermédiaire de Gemini à grande échelle dans son propre écosystème, en commençant par Bard, qui reçoit sa plus grande mise à jour à ce jour. Google a lancé Bard en février pour concurrencer ChatGPT, mais le chatbot n’a jamais été aussi performant. C’est maintenant à Gemini.

Le chatbot obtiendra donc de meilleures capacités de raisonnement grâce à Gemini, ce qui se traduira par de meilleures réponses, plus directes. Mais Bard deviendra également plus compétent en matière de codage et s’enrichira de capacités multimodales. Ce dernier point signifie que Bard ne se limitera pas au texte à texte, mais qu’il pourra également traiter et produire des images, du son et de la vidéo.

Sur sa chaîne jumelle YouTube, Google présente une démo montrant comment un célèbre influenceur crée un avion en papier à l’aide de Bard. On a remarqué que de telles fonctionnalités sont également déjà intégrées dans la dernière version de ChatGPT. Google est donc encore un peu à la traîne. Les nouvelles fonctionnalités de Bard ne sont également disponibles qu’en anglais pour l’instant, mais bien en 170 pays à ce jour.

Google a prévu une version « Bard Avancée » au début de l’année prochaine, qui fonctionnera avec Gemini Ultra. Gemini Pro sera également introduit peu à peu au sein du moteur de recherche, de Chrome et d’autres services Google. On proposera aussi le modèle aux développeurs dans Google Cloud par l’intermédiaire de Vertex AI.

L’IA sur le smartphone

Pour que le meilleur de l’IA soit aujourd’hui à votre portée à tout moment et en tout lieu, Google lance Gemini Nano. C’est une version « plus petite » du LLM spécialement conçue pour être incorporée dans les processeurs des smartphones. Et Google a déjà préparé ses propres derniers smartphones Pixel à cet effet en intégrant une TPU dans la puce Tensor. Ainsi, de nombreuses nouvelles fonctionnalités d’IA, notamment le traitement d’images, seront déployées sur les derniers appareils avec des mises à jour logicielles.

La version la plus puissante, Gemini Ultra, est encore bloquée pour le moment. Seulement quelques clients peuvent déjà expérimenter le modèle dans un environnement contrôlé. Gemini Ultra fait un grand pas vers l’intelligence artificielle générale, où l’IA a complètement simulé les humains, et Google veut donc mener des tests de sécurité encore plus poussés avant de mettre cette technologie entre les mains du grand public.

En lançant Gemini, Google montre au moins qu’il revient dans la course à l’IA en pleine forme. Il est évident que le battage autour de l’IA générative ne se calmera pas encore aussitôt en 2024. Alors que cette année, l’accent était encore principalement mis sur le jeu et l’expérimentation, l’année prochaine, la valeur ajoutée de la technologie ne devrait vraiment devenir visible.

newsletter

Abonnez-vous gratuitement à ITdaily !

Category(Required)
This field is for validation purposes and should be left unchanged.
retour à la maison