Wat is Gemini Live en wanneer zal het beschikbaar zijn

Wat is Gemini Live en wanneer zal het beschikbaar zijn

Google heeft onlangs een hele reeks updates aangekondigd voor zijn Gemini AI-model, waaronder verschillende upgrades en nieuwe modellen. Eén daarvan kreeg veel aandacht: Gemini Live, een multimodaal AI-model met video- en spraakmogelijkheden.

Sinds Bard in februari werd omgedoopt tot Gemini, dient het AI-model als vervanging voor Google Assistant op Android-apparaten. Het is echter vrij beperkt in wat het momenteel kan doen. Met Gemini Live wil Google hier verandering in brengen door een krachtiger en veelzijdiger AI-model aan te bieden.

Wat is Gemini Live?

Om gebruikers een verbeterde AI-ervaring te bieden en om OpenAI’s GPT-4o verbeterde ChatGPT over te nemen, heeft Google onlangs Gemini Live aangekondigd op zijn I/O Developer Conference. Met Gemini Live kunnen gebruikers in realtime natuurlijke en gepersonaliseerde gesprekken voeren via spraak en later via video.

Het nieuwe AI-model maakt deel uit van Google’s Project Astra, de poging van de zoekgigant om een ​​universele AI-assistent te bouwen die verschillende soorten input uit het dagelijks leven kan gebruiken om hulp te bieden. Gemini Live kan bijvoorbeeld tekst, beelden van de camera van uw smartphone en uw stem gebruiken om vragen te beantwoorden.

Volgens Google zal het nieuwe natuurlijke taalmodel gebruikers niet alleen helpen problemen op te lossen en verschillende acties uit te voeren, maar zich ook volledig natuurlijk voelen tijdens interacties. Gebruikers kunnen Gemini Live starten door op het stempictogram op hun telefoon te tikken, waardoor de AI op volledig scherm wordt weergegeven met een audiogolfvormeffect.

U kunt dan met de AI praten, net zoals u met een echte persoonlijke assistent zou doen. Een uitstekend voorbeeld van hoe het geüpgradede AI-model u kan helpen, is wanneer u het vraagt ​​om u te helpen bij de voorbereiding van een sollicitatiegesprek. Gemini Live stelt de vaardigheden voor die u kunt benadrukken, geeft tips voor spreken in het openbaar en meer.

Functies

Gemini Live wordt geleverd met een paar functies die het tot een veel betere AI-assistent maken dan Google Assistant, Apple’s Siri of Amazon’s Alexa.

Tweerichtingsgesprekken

Met Gemini Live kun je ermee praten en krijg je menselijke verbale reacties, wat resulteert in boeiende en intuïtieve gesprekken. U kunt hem bijvoorbeeld naar het weer vragen en u krijgt een nauwkeurige en beknopte update.

Slimme assistent-mogelijkheden

Het AI-model kan dienen als een slimme assistent en taken uitvoeren zoals het samenvatten van informatie uit e-mails en het bijwerken van uw agenda. U kunt bijvoorbeeld een foto maken van een concertflyer, waarna Gemini het evenement aan uw agenda toevoegt.

Visuele mogelijkheden

Door de camera op uw smartphone te gebruiken, kan Gemini Live video’s in realtime opnemen. Hierdoor kan het objecten identificeren en vragen hierover beantwoorden. Als u bijvoorbeeld de camera van uw smartphone op een luidspreker richt en Gemini vraagt ​​om deze te identificeren, zal deze u vertellen wat het is en zelfs het merk en model identificeren.

Bron: Google

Hoe werkt Gemini Live?

Project Astra kan spraak- en visuele invoer combineren, waardoor ze gemakkelijk te begrijpen zijn voor het AI-model. Zij kan dan op de informatie reageren en de benodigde hulp bieden. Net als OpenAI’s GPT-4o-aangedreven ChatGPT is Gemini Live een multimodale AI en vertrouwt hij niet uitsluitend op tekst als invoer.

Terwijl Gemini Live oorspronkelijk spraakinvoer zal gebruiken om gegevens te verzamelen en te analyseren bij de eerste release, zal het de komende maanden worden geüpgraded om ook video’s te verwerken en analyseren door ze frame voor frame op te splitsen voor een beter begrip en interactie.

De AI kan zich aanpassen aan de snelheid waarmee verschillende gebruikers spreken, en u kunt hem zelfs onderbreken om opheldering te vragen of meer informatie te geven. Het vermogen ervan om de menselijke dialoog na te bootsen kan voor een boeiendere interactie zorgen. Je kunt er dus een heen-en-weergesprek mee voeren, net als met een menselijke assistent. Bovendien kun je kiezen uit tien verschillende stemmen voor de AI.

GPT-4o versus. Tweeling Live

Hoewel zowel GPT-4o als Gemini Live multimodale AI-modellen zijn, is het op dit moment moeilijk om te zien welke in het echte leven beter presteert, vooral omdat geen van beide op dit moment openbaar beschikbaar is.

In tegenstelling tot ChatGPT vertrouwt Gemini Live echter op andere AI-modellen zoals Google Veo en Imagen 3 voor het leveren van output in de vorm van video’s en afbeeldingen. Desondanks leek ChatGPT in de demo’s van OpenAI en Google natuurlijker en kon het nieuwe GPT-4o-model zelfs menselijke emoties detecteren en simuleren via stemtonen.

Bovendien kan het zich aanpassen aan de manier waarop u wilt dat het antwoordt, wat Gemini Live niet kan doen, althans in de huidige staat.

Gemini Live-beschikbaarheid

Gemini Live zal beschikbaar zijn voor Gemini Advanced-abonnees, de betaalde versie van de AI-chatbot. Het zal de komende maanden worden uitgerold en zal naar verwachting tegen het einde van het jaar op grote schaal beschikbaar zijn.

Apps zoals Google Messages zullen volledig kunnen profiteren van Gemini Live, waardoor gebruikers rechtstreeks vanuit de berichten-app met de AI kunnen communiceren.

Gemini Live zou wel eens de volgende grote upgrade kunnen zijn van de AI-chatbot van Google, en precies wat hij nodig heeft om het op te nemen tegen rivalen als OpenAI’s ChatGPT. Met multimodale functionaliteit en krachtige spraakmogelijkheden kan het geüpgradede model Google helpen succes te behalen bij het leveren van een veelzijdige en betrouwbare digitale assistent.

Op dit moment heeft Google alleen aangekondigd dat het het nieuwe AI-model naar betaalde abonnees zal brengen. Hoewel hiermee gratis gebruikers, die een groot deel van Google’s gebruikersbestand uitmaken, buiten beschouwing worden gelaten, hopen we dat Google zijn standpunt verandert en besluit de beschikbaarheid van Gemini Live uit te breiden.

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *