OpenAI’s o3-mini is uitgebracht op 31 januari 2025. O3-mini is het nieuwste model in OpenAI’s redeneerserie, ontworpen om geavanceerde mogelijkheden te bieden op het gebied van wetenschap, technologie, techniek en wiskunde (STEM), met specifieke sterke punten in codering, wiskunde en wetenschappelijk redeneren. Het biedt snellere reacties en verbeterde nauwkeurigheid vergeleken met zijn voorgangers, zoals o1-mini.
Een van de opvallende kenmerken van o3-mini is de ondersteuning voor verschillende ontwikkelaarsfuncties, waaronder functieaanroepen, gestructureerde uitvoer en ontwikkelaarsberichten, waardoor het geschikt is voor integratie in diverse toepassingen. Daarnaast biedt het drie niveaus van redeneerinspanning: laag, gemiddeld en hoog, waardoor gebruikers snelheid en nauwkeurigheid kunnen afstemmen op hun specifieke behoeften. Het is echter belangrijk om op te merken dat o3-mini geen visuele mogelijkheden ondersteunt; voor taken waarbij visueel redeneren betrokken is, wordt het o1-model van OpenAI aanbevolen.
Toegang tot o3-mini varieert afhankelijk van het gebruikersabonnement. ChatGPT Plus-, Team- en Pro-abonnees kunnen o3-mini rechtstreeks selecteren in de modelkiezer, terwijl gebruikers van het gratis plan o3-mini kunnen uitproberen door de optie ‘Reden’ te selecteren in de berichtcomponist of door een antwoord te regenereren. Dit is de eerste keer dat een redeneermodel beschikbaar is gesteld aan gratis gebruikers in ChatGPT.
Wat betreft prestaties hebben evaluaties aangetoond dat o3-mini nauwkeurigere en duidelijkere antwoorden produceert, met sterkere redeneervaardigheden, dan o1-mini. Testers gaven 56% van de tijd de voorkeur aan de antwoorden van o3-mini op o1-mini en zagen een vermindering van 39% in grote fouten bij moeilijke vragen uit de echte wereld. Met gemiddelde redeneerinspanning evenaart o3-mini de prestaties van o1 bij enkele van de meest uitdagende redeneer- en intelligentie-evaluaties, waaronder de American Invitational Mathematics Examination (AIME) en de General Physics Question Answering (GPQA) benchmark.
Al met al vertegenwoordigt o3-mini een aanzienlijke vooruitgang in kosteneffectieve redeneermodellen en biedt het verbeterde prestaties en flexibiliteit voor een breed scala aan technische toepassingen.