Une image suffit : Microsoft travaille sur un générateur audio-image

microsoft mwc

Des documents de brevet montrent que Microsoft travaille sur une nouvelle fonction d’intelligence artificielle qui crée des images basées sur le son en direct pendant les réunions pour que la communication devienne visuelle.

Une image vaut mille mots : Microsoft prend cette expression au pied de la lettre. Microsoft a déposé un brevet pour une nouvelle technologie d’intelligence artificielle capable de convertir le son en direct en images. Elle pourrait notamment permettre d’organiser des réunions Teams avec des images.

Le document technique du brevet explique le fonctionnement du système. L’IA écoute les réunions et convertit l’audio en texte pour elle-même. À partir de ces résumés textuels, le modèle génère ensuite des images associées à la conversation. Tout cela se fait en temps réel, de sorte que les images suivent le plus fidèlement possible le contenu de la réunion.

Voir, entendre et parler

Déposer un brevet n’implique pas forcément que Microsoft prévoit de lancer la technologie auprès du grand public. Mais le géant du logiciel la considère comme un complément utile pour les appels vidéo.

» Utilisées en complément de la communication verbale, les images peuvent aider à clarifier les concepts et à les rendre plus compréhensibles, ce qui peut être particulièrement bénéfique pour les personnes qui apprennent mieux avec des aides visuelles », explique Microsoft dans son argumentaire sur la technologie.

Grâce à de nouvelles mises à jour, Microsoft Copilot a d’ores et déjà les yeux et la capacité de parler. Microsoft cherche à rendre son assistant d’intelligence artificielle accessible à tous. Elle y réussit plus ou moins bien : le nombre d’utilisateurs de Copilot augmente chaque mois, mais tout le monde n’est pas encore convaincu de son utilité pour leur travail, y compris le PDG de Salesforce, Marc Benioff.

newsletter

Abonnez-vous gratuitement à ITdaily !

Category(Required)
This field is for validation purposes and should be left unchanged.