Gemini Flash 2.0 a fait ses débuts la semaine dernière et bénéficie déjà d’une mise à niveau : la possibilité de regarder YouTube à notre place.
Si vous utilisez YouTube comme ressource pour cuisiner, faire des réparations à la maison, bricoler ou faire des recherches, vous savez à quel point il peut être frustrant d’arriver à la séquence voulue. Cela va changer avec Gemini Flash 2.0 qui peut désormais regarder une vidéo YouTube, en extraire les parties importantes et même répondre à des questions complémentaires.
Gemini avait déjà la possibilité de résumer des vidéos, mais cette nouvelle application va plus loin.
Comment ça marche
Pour analyser une vidéo YouTube avec Gemini, il suffit de coller le lien de la vidéo dans Gemini.
Vous pouvez poser des questions spécifiques, comme une liste d’ingrédients pour une recette ou une liste de fournitures pour un bricolage, demander un résumé général ou une idée clé, ou obtenir une transcription de ce que dit l’orateur.
Gemini s’inspirera à la fois de la vidéo elle-même et de la description de la vidéo.
Les résultats
Pour tester le produit, j’ai envoyé à Gemini un lien YouTube montrant comment effectuer une réparation à la maison que je remettais à plus tard et je lui ai demandé de décomposer la vidéo en instructions étape par étape. La vidéo de 12 minutes comporte ses propres étapes dans la description (quatre étapes seulement), mais en quelques secondes, Gemini a répondu avec son propre plan en six étapes et une petite explication pour chacune.
Ce n’est pas parfait, cependant. J’ai donné à Gemini un lien vers une vidéo pour une recette de gâteau et je lui ai demandé de la traduire en une recette écrite (la recette écrite réelle n’était pas dans la description). Gemini a répondu avec les ingrédients et le processus, mais n’a pas donné les quantités réelles pour les ingrédients. Lorsque je lui ai demandé de fournir les quantités, Gemini a dit qu’il ne pouvait pas et m’a proposé une recette similaire qu’il avait trouvée en ligne.
Les quantités réelles étaient, bien sûr, dans la vidéo.
Une test avec l’Université de Yale
Pour tester les capacités de recherche, j’ai trouvé une conférence de l’Université Yale qui durait un peu plus d’une heure. J’ai demandé à Gemini un résumé et il m’a donné un paragraphe soulignant les points clés. J’ai demandé un résumé général que je pourrais utiliser pour étudier et Gemini m’a fourni un plan en sept points avec environ trois points supplémentaires sous chaque point principal.
Au premier coup d’œil, j’ai eu l’impression d’avoir bien compris le cours et il m’a fallu moins de cinq minutes pour le lire.
Dans l’ensemble, cette fonctionnalité a le potentiel d’être incroyablement utile et permet d’utiliser YouTube comme ressource sans avoir à regarder une vidéo entière. Cette fonctionnalité est présente à la fois sur Gemini en ligne et sur l’application, et elle est disponible même si vous n’utilisez que la version gratuite.