De modellenkaart: welke AI wanneer?

Claude, GPT, Gemini, open-source — praktische keuze-gids

Als je het AI-landschap nu voor het eerst binnenloopt, voelt het als een schap in de supermarkt waar alle verpakkingen op elkaar lijken. Claude, GPT, Gemini, Llama, Mistral, Qwen, DeepSeek — allemaal "grote taalmodellen", allemaal "state of the art", allemaal "beste keuze voor jouw use case". Verleidelijk om gewoon te pakken wat je concurrent gebruikt en door te stampen. Maar de verschillen zijn echt, en als je bouwt — een SaaS, een widget, een interne tool — dan bepaalt de juiste keuze of je maandrekening tien euro of duizend euro wordt. Tijd om orde te brengen in dat schap.

De eerste splitsing: frontier of goedkoop

Elke aanbieder heeft grofweg twee categorieën. Bovenaan zitten de frontier-modellen: duur, traag, maar zo slim als het op dit moment gaat. Daaronder zitten de snelle en goedkope modellen: een fractie van de prijs, een fractie van de latency, en voor veel taken echt goed genoeg.

Bij Anthropic is het in 2026 Claude Opus 4.7 aan de top, Sonnet 4.6 in het midden, Haiku 4.5 onderaan. Bij OpenAI heb je GPT-5 en kleinere varianten. Bij Google zit Gemini 2.x in zijn Pro- en Flash-smaken. Namen veranderen snel — elke zes maanden een nieuwe versie is het ritme geworden.

De regel die je moet internaliseren: gebruik niet standaard het duurste model. Dat is de valkuil waar iedereen in stapt. Je test met Opus of GPT-5, het werkt briljant, je rolt uit, en een maand later kijk je naar een factuur die je niet had verwacht. De goedkopere modellen zijn voor 80% van de taken prima. Classificatie, herformulering, simpele samenvattingen, eerste-lijn klantvragen — dat hoeft niet op een frontier-model te draaien.

✦ Het prijsverschil is enorm

In 2026 kost Claude Sonnet ongeveer $3 per miljoen input-tokens en $15 per miljoen output. Haiku zit rond $1 input en $5 output. Opus ligt vele malen hoger. Voor een klantenservice-widget die 100.000 vragen per maand verwerkt, kan het verschil tussen "Opus voor alles" en "Haiku met Sonnet-fallback bij lastige gevallen" zomaar een factor 10 in je kosten zijn.

Claude — als je schrijft, codeert of redeneert over lange teksten

Claude, van Anthropic, is in de praktijk sterk op drie dingen. Eén: lange context. Je kunt er zonder morren 200.000 tokens in gooien, en bij sommige versies tot een miljoen. Dat betekent: een hele codebase, een heel jaarverslag, twintig klantmails achter elkaar — en Claude blijft de draad vasthouden.

Twee: coderen. Ontwikkelaars kiezen Claude massaal voor code-review, refactoring en het schrijven van niet-triviale functies. Het maakt minder snel dingen op dan een aantal concurrenten, en het denkt mee over edge cases. Voor een SaaS-bouwer is dat goud waard.

Drie: schrijven in natuurlijke stijl. Claude schrijft minder "corporate robot" dan de gemiddelde GPT-output. Als je klantmails, interne documentatie of blogposts wilt genereren die niet meteen herkenbaar-AI klinken, valt Claude vaak positief op.

Zwakker: real-time informatie (geen ingebouwde browser in alle contexten), en een iets voorzichtige houding — Claude weigert vaker dan GPT om risky zaken op te pakken, wat soms handig en soms irritant is.

GPT — het brede zwaard

GPT-5 van OpenAI is de breedste generalist. Goed in bijna alles, zelden uitzonderlijk. De ecosystem is het grootst: tooling, plugins, integraties in elke SaaS onder de zon. Als je iets "standaard" wilt dat zeker werkt met een miljoen andere tools, is GPT meestal een veilige keuze.

Sterk op: functie-calls (je model laten beslissen welke API aan te roepen), multi-step agents, brede kennis over niche-onderwerpen, en beeldgeneratie via de gekoppelde modellen. Ook: groot en volwassen platform met Assistants API, fine-tuning, batch-processing.

Zwakker: soms wat sleurder in pure tekstkwaliteit, en de modellen voelen af en toe "te behulpzaam" — in de zin dat ze dingen toevoegen die je niet vroeg. Dat is temmen met een goede system prompt, maar het is werk.

Gemini — als Google en multimodaal belangrijk zijn

Gemini van Google heeft twee hoofdtroeven. Eén: echte multimodaliteit. Beelden, audio, video — Gemini slikt het en werkt ermee. Wil je een model dat een productvideo kan samenvatten, of spraak kan analyseren, dan is Gemini vaak de eerste halte. Twee: integratie met het Google-ecosysteem (Workspace, Drive, Gmail) is strakker dan bij de concurrenten.

Gemini Pro is de frontier-versie, Flash is de snelle en goedkope variant. Gemini Flash is een van de goedkoopste en snelste modellen in zijn klasse — voor use cases waar latency telt (live widget, autocomplete) een sterke kandidaat.

Zwakker: als je niet in Google's ecosysteem zit, voelt de developer experience soms wat stroperig vergeleken met Anthropic of OpenAI.

✦ Kies niet één model voor altijd

Serieuze AI-bouwers hebben meestal tegelijk toegang tot minstens twee aanbieders. Niet uit trouwloosheid, maar omdat modellen in hun sterktes verschillen, en omdat je niet wilt dat één prijsverhoging of downtime jouw hele product onderuithaalt. Denk in termen van "welk model voor welke taak", niet "welk merk voor alles".

Open source — Llama, Mistral, Qwen, DeepSeek

Dit is de zijdeur die veel ondernemers vergeten. Meta (met Llama 4), de Franse club Mistral, de Chinese Qwen en DeepSeek — ze brengen modellen uit waarvan je de "gewichten" (de getrainde parameters) gewoon kunt downloaden. Dan draai je hem zelf, op je eigen server, of via een hoster zoals Together AI, Groq, of Fireworks.

Waarom zou je dat willen? Drie redenen. Privacy: data gaat niet naar een Amerikaanse of Chinese API. Kosten: bij hoog volume kan zelf hosten (of een gespecialiseerde hoster) factor 5 tot 10 goedkoper zijn. Controle: geen rate limits, geen verrassende veranderingen in modelgedrag, en fine-tuning op je eigen data is vaak makkelijker.

De keerzijde: je krijgt niet helemaal de frontier-kwaliteit. De open-source modellen lopen meestal zes tot twaalf maanden achter op wat Claude en GPT kunnen. Voor een deel van de taken merk je dat niet. Voor ingewikkeld redeneren wel. En: zelf hosten betekent zelf verantwoordelijk zijn voor uptime, GPU-kosten en tuning. Geen gratis lunch.

Een simpele keuze-gids

Hier is hoe je er praktisch over kunt denken als solo-bouwer:

Code schrijven of reviewen: Claude Sonnet of Opus. Claude heeft hier een kleine voorsprong op ervaringsbasis.
Klantmails, blogposts, marketingteksten: Claude Sonnet voor kwaliteit, Haiku voor volume.
Klantenservice-widget: Haiku of Gemini Flash als eerste lijn, Sonnet als fallback voor lastige vragen.
Classificatie (is deze mail spam / is dit een factuur / welk onderwerp): Haiku, Gemini Flash, of zelf-gehoste Mistral. Overkill is dom hier.
Beeld, audio, video erbij: Gemini of GPT-5 met vision.
Privacygevoelige data (medisch, juridisch, HR): overweeg zelf-gehoste Llama of Mistral, of in elk geval een EU-regio bij je aanbieder.
Functies aanroepen vanuit het model (tool use): alle drie de grote aanbieders kunnen het; GPT heeft het meest volwassen ecosysteem hierin.

Wat je vandaag kunt doen

Maak één lijstje: welke taken wil je laten uitvoeren door AI in je product of bedrijf? Schat voor elk hoe vaak dat gebeurt per maand. Bepaal voor elke taak: heeft het frontier-kwaliteit nodig, of is "goed genoeg en snel" genoeg? Pak voor de eenvoudige taken een klein model, voor de zware een groter. Dat is de volwassen aanpak, en het scheelt je misschien 80% van de kosten zonder dat iemand het verschil merkt.

Drie dingen om mee te nemen

Niet één model voor alles. Gebruik goedkope modellen voor eenvoudige taken en reserveer frontier-modellen voor werk dat hun kwaliteit echt nodig heeft. Dit is de belangrijkste kostenknop die je hebt.
Merk is minder belangrijk dan fit. Claude is sterk in code en lange tekst, GPT is de brede generalist met het grootste ecosysteem, Gemini scoort op multimodaal en Google-integratie, open-source geeft je privacy en controle. Kies op taakfit, niet op hype.
Bouw voor modelwissels. Abstractie-laagjes in je code maken dat je over een half jaar van aanbieder kunt wisselen zonder je hele product te herschrijven. Modellen veranderen snel — jouw architectuur moet daarmee kunnen ademen.

In de volgende les gaan we naar de rekenmachine. Wat kost al dit plezier eigenlijk? Hoe werken tokens in je portemonnee, waar gaan de verborgen kosten zitten, en hoe zorg je dat een enthousiaste lancering je niet de kop kost? Daar gaan we praktisch mee rekenen.

Tot dan. Kies je gereedschap bewust.

← Vorige

Wat doet een taalmodel écht

Cursus

↑ Overzicht

Wat kost AI eigenlijk?