Alors que de nombreux passionnés étaient impatients de découvrir les annonces du Google I/O 2024, OpenAI a pris tout le monde de court en dévoilant GPT-4o, un jour avant l’événement. Ce modèle multimodal est capable d’entretenir une conversation avec une voix naturelle et peut même commenter des images en temps réel. Pour prouver sa supériorité face à ce concurrent, Google a fait des annonces spectaculaires lors de son keynote du 14 mai 2024. Apparemment, le géant des moteurs de recherche veut démontrer qu’il reste un acteur incontournable dans la course à l’IA générative avec une version améliorée de Google Gemini.
Google Gemini : Quelles sont ses nouvelles fonctionnalités ?
Comme chaque année depuis plus de 15 ans, la société basée à Mountain View a présenté les toutes dernières nouveautés de ses services. Pour cette édition de 2024, l’intelligence artificielle a incontestablement pris le pas sur tout le reste de la présentation. Naturellement, les visiteurs et participants ont pu découvrir les mises à jour de Gemini, l’IA conversationnelle de Google.
Parmi les annonces les plus marquantes, on retrouve les nouvelles versions du chatbot. Gemini 1.5 Pro utilise désormais une architecture basée sur le « Mixture of Experts », permettant de traiter jusqu’à un million de tokens de contexte. Cette capacité dépasse largement les 128 000 tokens de GPT-4. Sundar Pichai, PDG du groupe Alphabet, qui est la maison mère de Google, a également présenté Gemini 1.5 Flash.
Cette version est plus légère et optimisée pour des tâches nécessitant une faible latence, tout en fournissant des réponses extrêmement rapides. Les démonstrations ont montré que Gemini peut analyser des documents volumineux, des heures de vidéo, et même des codes informatiques complexes. La version avancée, Gemini Advanced, est proposée dans le cadre de l’offre premium Google One AI et débloque des capacités avancées, comme l’analyse de données et la personnalisation.
Progressivement, Google Gemini remplacera l’Assistant Google sur Android et peut-être bientôt sur iOS, mettant Apple dans une situation délicate. En effet, la marque à la pomme pourrait intégrer ChatGPT dans la prochaine version de son système d’exploitation, à moins qu’elle ne développe son propre modèle de langage.
Projet Astra : La Réponse de Google pour Rivaliser avec GPT-4o ?
L’un des moments forts du keynote de Google I/O 2024 a été la présentation du Projet Astra. DeepMind, la filiale d’IA de Google, le décrit comme le « futur des assistants IA » de Google. Astra a pour ambition de créer une intelligence artificielle générale et multimodale, capable d’interagir de manière naturelle avec son environnement.
Porté par l’intelligence artificielle de Google Gemini, ce projet se présente sous la forme d’une application Android proposant une interaction vocale et visuelle en temps réel. Lors d’une démonstration, Astra a répondu instantanément à des questions tout en analysant son environnement à l’aide de la caméra du smartphone connecté.
Cette démonstration rappelle celle de GPT-4o d’OpenAI, dévoilée le 13 mai 2024. Bien que la voix de synthèse d’Astra soit légèrement moins naturelle, il demeure un concurrent sérieux d’OpenAI. En outre, Astra bénéficie des capacités multimodales avancées développées par DeepMind, spécialisée dans l’intelligence artificielle.
Pour l’instant, Astra n’est encore qu’un prototype. Google prévoit d’intégrer certaines de ses fonctionnalités dans l’application Gemini d’ici la fin de l’année. Un des défis de Google est de réduire le temps de réponse pour rendre la conversation plus fluide et naturelle, ce qu’OpenAI affirme avoir déjà réalisé avec GPT-4o.
De plus, Google envisage d’intégrer Astra à des lunettes de réalité augmentée, ce qui pourrait redéfinir l’expérience des Google Glass, abandonnées il y a quelques années. L’objectif est de fournir un assistant IA visuel omniprésent, capable de commenter l’environnement de l’utilisateur et de l’aider dans diverses tâches.
Voici les Autres Nouveautés Présentées lors du Google I/O 2024
Le Google I/O 2024 a également été l’occasion pour la société de dévoiler de nombreuses nouveautés en matière d’IA. Parmi celles-ci :
La nouvelle version du système d’exploitation mobile, Android 15, intégrera Gemini Nano. Cette version locale respectera la vie privée et sera capable de détecter les tentatives d’arnaques lors des appels téléphoniques.
L’IA Overviews sera intégrée directement au moteur de recherche Google, générant des résumés organisés à partir des résultats, reléguant ainsi les sites web traditionnels au second plan.
Dans Google Photos, l’outil « Ask Photos » permettra de demander à Gemini de retrouver des souvenirs spécifiques parmi vos images. Par exemple, en tapant « Montre-moi les photos de mon fils », l’intelligence artificielle s’exécutera.
Dans Google Workspace, les applications de productivité comme Gmail et Google Meet bénéficieront de l’intégration de Google Gemini, offrant des fonctionnalités telles que la synthèse automatique de vos e-mails ou de vos réunions.
Le modèle d’IA consacré à la création d’images, Imagen, passe à la version 3 avec une meilleure compréhension du langage. Google a aussi dévoilé Veo, un nouvel outil de génération de vidéos haute résolution à partir de textes, d’images et de vidéos existantes, rivalisant avec Sora d’OpenAI.
Les Gems seront similaires au GPT Store d’OpenAI, offrant des assistants virtuels personnalisables permettant aux utilisateurs de Gemini de modeler l’IA selon leurs besoins spécifiques.
L’offre Google One AI Premium en France
Pour accompagner le déploiement de son modèle LLM, Google a annoncé la mise en place de son offre Google One AI Premium en France. Celle-ci sera disponible pour 21,99 euros par mois, permettant aux utilisateurs d’accéder à Gemini 1.5 Pro. En outre, cet abonnement inclut également 2 To de stockage cloud et d’autres services Google. Cette offre est une réponse directe à GPT Plus, lancé par OpenAI pour accéder à ChatGPT en version premium.