OpenAI onthult GPT-4o Mini, het goedkoopste kleine AI-model tot nu toe

OpenAI onthult GPT-4o Mini, het goedkoopste kleine AI-model tot nu toe

Er is weer een AI-model bijgekomen in de zee van AI-modellen en dit is er weer eentje van OpenAI. OpenAI bracht eerder dit jaar GPT-4o uit, wat efficiënter zou moeten zijn dan GPT-4. Maar het was nog steeds vrij duur en kon een behoorlijke rekening opleveren, vooral voor ontwikkelaars die het AI-model via de API voor hun apps herhaaldelijk gedurende de dag moeten aanroepen.

Als gevolg hiervan stapten ontwikkelaars over op goedkopere, kleine AI-modellen van concurrenten, zoals Gemini 1.5 Flash of Claude 3 Haiku.

Nu brengt OpenAI de GPT-4o mini uit, hun meest kostenefficiënte model tot nu toe, waarmee ze ook de markt voor kleine AI-modellen betreden. Hoewel de GPT-4o mini hun goedkoopste model tot nu toe is, bereikt het die lage kosten niet door te bezuinigen op intelligentie; het is slimmer dan hun bestaande GPT-3.5 Turbo-model.

Volgens OpenAI scoorde GPT-4o mini 82% in MMLU (Measuring Massive Multitask Language Understanding), waarmee het veel modellen overtrof; dit zijn de respectievelijke scores van verschillende modellen: GPT-3.5 Turbo (70%), Claude 3 Haiku (75,2%) en Gemini 1.5 Flash (78,9%). GPT-4o scoorde 88,7% op deze benchmark, waarbij Gemini Ultra de hoogste score behaalde – 90% (dit zijn echter geen kleine AI-modellen).

Bron: OpenAI

GPT-4o mini wordt vandaag uitgerold naar ChatGPT Free, Team en Plus gebruikers en ontwikkelaars. Voor ChatGPT gebruikers heeft het in feite GPT-3.5 vervangen; GPT-4o mini zal het model zijn waar het gesprek standaard naar overgaat zodra u geen gratis GPT-4o query’s meer hebt. Ontwikkelaars zullen nog steeds de optie hebben om GPT-3.5 te gebruiken via de API, maar het zal uiteindelijk worden geschrapt. ChatGPT Enterprise gebruikers krijgen volgende week toegang tot GPT-4o mini.

Zoals hierboven vermeld, is de focus van GPT-4o mini om ontwikkelaars te helpen een low cost en latency model te vinden voor hun app dat ook capabel is. Vergeleken met andere kleine modellen blinkt GPT-4o mini uit in redeneertaken in zowel tekst als visie, wiskundige redeneer- en coderingstaken, evenals multimodale redenering.

Momenteel worden zowel tekst als beeld ondersteund in de API. Ondersteuning voor tekst-, beeld-, video- en audio-invoer en -uitvoer is gepland voor de toekomst.

GPT-4o mini heeft een contextvenster van 128K tokens voor invoer en 16K tokens voor uitvoer per aanvraag, met kennis die geldig is tot oktober 2023. Het kan ook vrij kosteneffectief niet-Engelstalige tekst verwerken.

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *