- De kwaliteitssprong van het nieuwe model van OpenAI is bescheiden, maar het is verbeterd op een cruciaal gebied: programmeren
- Dat lijkt verschillende bedrijven te hebben overtuigd, die het nu al verkiezen boven hun belangrijkste concurrent op dat gebied, Anthropic
- De prijs is ook een belangrijke factor: GPT-5 is tot 7,5 keer goedkoper dan Claude Opus 4.1.
De lancering van GPT-5 was over het algemeen teleurstellend. OpenAI moest met dit model de grootste sprong in de geschiedenis van AI maken, maar we hebben een model gekregen dat weliswaar beter is, maar niet spectaculair. Toch bereikt het iets dat belangrijker is dan het lijkt: het overtuigt bedrijven.
Bedrijven <3 GPT-5. De lancering werd omgeven door kritiek, maar het model lijkt steeds meer bedrijven te overtuigen. Onder hen zijn Cursor, Vercel, JetBrains en Factory, die beweren dat ze GPT-5 tot hun standaardmodel voor verschillende producten hebben gemaakt omdat het sneller opstart en betere resultaten levert bij complexe taken. Aaron Levi, CEO van Box, zei op CNBC dat GPT-5 “een grote doorbraak” is en een niveau van redeneren heeft dat andere modellen niet kunnen evenaren. P
Van woorden naar daden. De aankondigingen van de verantwoordelijken van deze bedrijven op hun respectieve blogs geven natuurlijk een zeer positief beeld, maar we moeten niet vergeten dat deze verklaringen samenvallen met de lancering en onder andere deel uitmaken van de bedrijfsdynamiek: bedrijven steunen elkaar omdat dit hun allianties voor de toekomst versterkt. Maar diezelfde bedrijven die over GPT-5 spreken, zijn noodzakelijkerwijs agnostisch: ze zijn gateways voor een groot aantal modellen die gebruikers vervolgens gebruiken om te beslissen welke op dat moment het beste bij hen past.
Cursor maakt het bijvoorbeeld mogelijk om Claude Opus 4.1, GPT-5, maar ook een groot aantal andere AI-modellen te gebruiken die voor gebruikers interessanter kunnen zijn, zowel qua prestaties als qua prijs. De verklaringen van anonieme bronnen die dicht bij deze bedrijven staan, zijn veelbelovend voor OpenAI, maar niet definitief.
Anthropic in moeilijkheden? De grote verliezer in dit geval is Anthropic, dat bijzonder goed aangeschreven stond in het zakelijke segment. Maar GPT-5 heeft verbeteringen laten zien in de benchmarks voor programmering en interfaceontwerp, twee gebieden waarop Claude, de chatbot van Anthropic, voorheen de voorkeur genoot van bedrijven. Volgens een onderzoek van Menlo Ventures was Claude er tot nu toe in geslaagd OpenAI voor te blijven bij het gebruik van zijn modellen in bedrijven. Het marktaandeel van Claude bedroeg 32%, tegenover 25% voor OpenAI.
Afhankelijkheid van de zakelijke markt. Anthripic is sterk afhankelijk van het gebruik van zijn chatbot en API in bedrijven: dat vertegenwoordigt 80% van zijn inkomsten. Het bedrijf doet het niet slecht en de jaarlijkse inkomsten zullen naar verwachting 17 keer hoger liggen dan in 2024. In de afgelopen zes maanden hebben ze zelfs 3 miljard dollar verdiend (1 miljard in juni) en zijn de contracten van acht en negen cijfers verdrievoudigd ten opzichte van vorig jaar. Bronnen dicht bij het bedrijf geven aan dat de gemiddelde uitgaven per klant in de afgelopen twaalf maanden vervijfvoudigd zijn.
GPT-5 lijkt goedkoper te zijn. Er is een belangrijke factor die OpenAI rechts inhaalt op Anthropic: GPT-5 is tot 7,5 keer goedkoper dan Claude Opus 4.1, de nieuwste versie van die chatbot. Voor zakelijke klanten is dat verschil natuurlijk cruciaal, waardoor ze het op veel grotere schaal kunnen inzetten, maar er zit een addertje onder het gras. Niet voor bedrijven, natuurlijk. Voor OpenAI. Het bedrijf pochte in juni dat het drie miljoen betalende zakelijke gebruikers had (in februari waren dat er nog twee), en GPT-5 lijkt dat aantal nog verder op te drijven. Anthropic zou er in theorie nog meer hebben, althans volgens de eerder genoemde studie van Menlo Ventures.
Maar. De prijzen van OpenAI voor zijn API geven aan dat GPT-5 kost 1,25 dollar per miljoen invoertokens en 10 dollar per miljoen uitvoertokens. Claude Opus 4.1 kost respectievelijk 15 en 75 dollar voor invoer/uitvoer. Het lijkt er zeker op dat GPT-5 veel goedkoper is, maar let op, want wanneer GPT-5 redeneringen toepast, kunnen er tussenstappen in het redeneringsproces worden gegenereerd en die tokens worden ook in rekening gebracht, ook al zijn ze niet “zichtbaar” in de uiteindelijke antwoorden. In die gevallen is GPT-5 misschien niet “zo goedkoop” in vergelijking met Claude Opus 4.1, dat momenteel zeker een van de duurste modellen is.
Modellen die ‘redeneren’ zijn succesvol in bedrijven. Het succes van GPT-5 in bedrijven is zowel te danken aan de verbetering van de programmeertaken als aan de redeneertaken. Deze variant van de modellen heeft het gebruik ervan bij deze klanten verachtvoudigd: zakelijke klanten maken intensief gebruik van redeneermodellen – die duurder maar ook nauwkeuriger zijn – vooral voor planningstaken en redeneertaken in verschillende fasen. Dat is waar GPT-5 lijkt uit te blinken, zoals blijkt uit de resultaten in tests zoals ARC-AGI 2.
Geld verbranden. OpenAI heeft een verkoopteam van meer dan 500 professionals opgezet om het product aan bedrijven te verkopen. Dit is een onafhankelijke inspanning van de alliantie met Microsoft – waarmee ze op deze markt concurreren – en er is een probleem. Die lage prijzen zijn niet reëel, omdat GPT-5 nog steeds erg duur is om aan gebruikers aan te bieden. OpenAI zal dit jaar naar verwachting ongeveer 8 miljard dollar uitgeven, en een nog intensiever gebruik van hun modellen betekent meer uitgaven voor infrastructuur om deze dienst te kunnen leveren.