OpenAI onthult eerste serie redeneermodellen: o1-lancering

Te midden van de buzz rondom OpenAI’s verwachte Project Strawberry-release, heeft het bedrijf zijn nieuwste model gelanceerd, OpenAI o1. Hoewel het officieel niet Strawberry heet, bevat deze release geavanceerde redeneermogelijkheden die talloze speculaties opriepen.

Naast OpenAI o1 is er een meer betaalbare variant genaamd OpenAI o1 mini. Deze zet de trend van OpenAI voort om kleinere modellen uit te brengen om ontwikkelaars beter te ondersteunen, na de introductie van GPT-4o mini.

De naam o1 staat voor een nieuwe start, waarmee het naamgevingssysteem dat bij eerdere modellen nogal ingewikkeld was, opnieuw werd ingesteld.

Het is belangrijk om op te merken dat o1 hogere operationele kosten heeft vergeleken met bestaande modellen, samen met tragere responstijden. De huidige versie is echter slechts een “preview” die de vroege ontwikkelingsfase weerspiegelt.

OpenAI o1 verschilt duidelijk van de GPT-modellen en beschikt over een unieke trainingsmethodologie die gebruikmaakt van een nieuw optimalisatiealgoritme en een nieuwe dataset.

Dit innovatieve model excelleert in het aanpakken van complexe problemen op gebieden zoals wetenschap, codering en wiskunde door middel van verbeterde redenering. OpenAI o1 maakt gebruik van reinforcement learning voor probleemoplossing, met een belonings- en strafmechanisme. In tegenstelling tot eerdere modellen die voornamelijk het volgende woord voorspelden, integreert o1 een “gedachtenketen” die aanzet tot effectief reageren op vragen. Deze vooruitgang betekent een belangrijke stap in de richting van het bereiken van menselijke intelligentie, wat leidt tot verbeterde nauwkeurigheid en verminderde neigingen tot hallucinaties (hoewel het nog steeds vatbaar is voor incidentele onnauwkeurigheden).

Wanneer een prompt wordt gepresenteerd, zal o1 zijn denkproces verwoorden, wat opmerkelijke verbeteringen in redeneervermogens laat zien vergeleken met eerdere modellen. Zo behaalde o1 een indrukwekkende score van 83% op de Internationale Wiskunde Olympiade (IMO), terwijl GPT-4o slechts 13% haalde.

Ondanks het vermogen om te redeneren en zijn denkprocessen te delen, is er een opgelegde limiet aan de denktijd. Gebruikers kunnen een prompt krijgen als: “Oh, ik heb bijna geen tijd meer; laat me snel een antwoord krijgen”, zoals gerapporteerd door The Verge.

Terwijl o1 bedreven is in het aanpakken van geavanceerde problemen die uitgebreide algemene kennis vereisen, is o1 mini beter geschikt voor codering, wiskunde en wetenschappelijke taken die geen breed begrip van algemene kennis vereisen. Bovendien is o1 mini aanzienlijk betaalbaarder, namelijk bijna 80% goedkoper dan o1.

Momenteel mist o1 functies die wel in GPT-4o te vinden zijn, zoals internet browsen of het accepteren van bestanden/afbeeldingen als invoer, hoewel OpenAI actief werkt aan het opnemen van deze mogelijkheden. De o1-modellen zijn specifiek ontworpen voor gebruikers die oplossingen nodig hebben voor complexe problemen, waaronder onderzoekers in de gezondheidszorg, natuurkundigen, economen en softwareontwikkelaars.

Wie heeft toegang tot het model? Vanaf vandaag hebben ChatGPT Plus- en Team-gebruikers toegang tot o1-preview en o1-mini. Edu- en Enterprise-gebruikers krijgen volgende week toegang. Gebruikers met het ChatGPT Free-abonnement hebben niet direct toegang, maar OpenAI streeft ernaar om in de toekomst o1-mini-toegang te bieden aan gratis gebruikers.

De gebruikslimieten voor beide modellen zijn vastgesteld op 30 wekelijkse berichten voor o1 en 50 voor o1-mini. Er zijn plannen om deze beperkingen in de toekomst te verhogen.

Qua prijs is de API voor o1 relatief duur; o1-preview kost $15 per miljoen input tokens en $60 per miljoen output tokens. Daarentegen kost GPT-4o $5 per miljoen input tokens en $15 per miljoen output tokens.

Hoe krijg je toegang tot de modellen? Gebruikers kunnen wisselen tussen o1 en o1-mini via het ChatGPT-menu. OpenAI werkt ook aan het automatiseren van modelselectie op basis van gebruikersprompts in de toekomst.

De lancering van o1 en o1-mini benadrukt OpenAI’s toewijding aan innovatie, waarmee het zich onderscheidt van zijn concurrenten. Als het model complexe redeneertaken succesvol kan uitvoeren, kan het een significante vooruitgang betekenen richting Artificial General Intelligence (AGI). Echter, sommige eerste feedback geeft aan dat o1 moeite kan hebben met basisredeneertaken.

Nieuwe O1 faalt nog steeds jammerlijk bij triviale vragen door
u/knowledgehacker in
ChatGPT

Terwijl OpenAI de o1-serie blijft ontwikkelen, blijven gebruikers hopen dat toekomstige updates de prestaties van het model zullen verbeteren. Bovendien is OpenAI van plan om nieuwe modellen binnen de GPT-serie te blijven uitrollen, waardoor de verwachtingen voor een potentiële GPT-5 levend blijven.

Bron