Wat komt eraan — 2026 en 2027

Waar het heen gaat, zonder hype

De AI-wereld beweegt snel genoeg om duizelig van te worden en langzaam genoeg om verrassend voorspelbaar te zijn. Elke week is er een launch die "alles verandert"; elk kwartaal blijkt dat het meeste stabiel blijft. In deze les scheid je signaal van ruis en kijk je naar wat er in 2026 en 2027 waarschijnlijk speelt — en belangrijker: wat daarvan nu al je architectuurkeuzes moet beïnvloeden en wat je prima nog even kunt laten wachten.

Langere context wordt normaal

In 2024 was 200.000 tokens veel. In 2026 is 1 miljoen tokens bij de frontier-modellen al mainstream geworden (Claude 4.7 heeft het, Gemini 2.x al langer). Voor 2027 is de vraag niet of het nog groter wordt, maar wat je ermee doet. Langere context maakt RAG minder urgent voor middelgrote documentcollecties — je kunt het hele handboek gewoon in de prompt gooien.

Wat dat praktisch betekent: voor kennisbanken onder een paar honderd pagina's hoef je misschien geen vector-database meer te bouwen. Gewoon de hele boel in de context, met prompt-caching om de kosten redelijk te houden. Voor grote archieven blijft RAG zinvol — meer tokens is altijd duurder dan slim retrieven.

Let op de prestatieval: modellen lezen 1 miljoen tokens, maar presteren vaak minder goed op vragen waar het antwoord diep in de context ligt ("lost in the middle"). Benchmarks zijn hier niet altijd eerlijk. Test met je eigen data voor je kritische toepassingen bouwt rond extreem lange contexten.

✦ Context is geen wondermiddel

Een miljoen tokens beschikbaar betekent niet dat je ze moet gebruiken. Scherpe, relevante context van 5.000 tokens verslaat vaak een dump van 500.000. Gebruik de ruimte als je hem nodig hebt, niet uit luiheid.

Inference wordt goedkoper

De prijzen per miljoen tokens voor vergelijkbare kwaliteit dalen jaarlijks met factor twee tot vier. Wat in 2023 Opus-niveau was kost in 2026 Sonnet-prijs. Dezelfde curve loopt door. Dit betekent dat veel use cases die vandaag net te duur zijn, over 18 maanden economisch zijn.

Architectuurimpact: bouw niet te strak tegen huidige prijsniveaus aan. Als je bij tien cent per aanvraag een mooie business hebt, blijft dat werken. Als je bij tien cent per aanvraag verlies draait en alleen bij één cent break-even haalt, ben je er over anderhalf jaar — maar in de tussentijd moet je kas-strak. Prijsdalingen zijn een tailwind, geen bedrijfsplan.

Agent-capaciteit groeit

"Agent" was in 2024 grotendeels marketing. In 2026 zijn er modellen en frameworks die echt meerstaps werk aankunnen: een taak opdelen, tools gebruiken, terugkomen op eerdere stappen, zichzelf corrigeren. Claude's computer-use, OpenAI's Responses API met tool-use, Google's Agent Builder — allemaal in productie-use door serieuze bedrijven.

Wat kan: gestructureerde multi-step workflows waarbij de agent bestanden leest, code draait, resultaten checkt. Wat nog worstelt: open-ended zelfsturende taken over uren van werk. Agents zijn in 2026 stagiair-niveau: nuttig binnen kader, onbetrouwbaar bij echte autonomie. Dat verschuift, maar langzamer dan de hype voorspelt.

Praktisch voor solo-bouwers: agent-achtige workflows bouwen heeft zin voor afgebakende taken (offerte genereren in vijf stappen, factuur triage). Geen zin voor "bouw mijn hele feature autonoom". De sweet spot is: mens definieert stappen, AI voert ze uit, mens controleert.

Open-source haalt in — maar langzaam

Llama 3.x, Qwen, DeepSeek en Mistral hebben in 2026 een niveau bereikt dat voor veel zakelijke taken (samenvatten, extraheren, classificeren) ruimschoots voldoet. Voor frontier-niveau redeneren en instructie-volgen lopen ze zes tot twaalf maanden achter op Claude/GPT/Gemini — en dat gat is stabiel, niet kleiner.

Voor jou als solo-bouwer: frontier-API is voorlopig de logische default. Open-source wordt interessant als je grote volumes hebt, privacy-eisen die API-calls verbieden, of een gespecialiseerde fine-tune nodig hebt. Anders betaal je met engineering-tijd wat je bespaart op API-kosten, en ontspoort dat rekensommetje meestal ten gunste van de API.

✦ De redelijke drempel

Als vuistregel: onder honderd miljoen tokens per maand en zonder specifieke privacy-drang is frontier-API economisch en operationeel beter. Boven dat volume, of met gevoelige data die echt niet de deur uit mag, wordt self-hosting serieuzer. De meeste solo-SaaS-bedrijven zitten ver onder die drempel.

Multimodal wordt standaard

Tekst-plus-beeld is in 2026 de default voor frontier-modellen. Claude en GPT-5 lezen afbeeldingen, PDF's met layout, diagrammen. Audio is eveneens gangbaar (speech-to-text is bijna gecommoditiseerd, text-to-speech snel volgens). Video wordt in 2027 wat beeld in 2024 was.

Voor jouw SaaS-toepassingen: denk vanaf nu vanzelfsprekend in termen van "de gebruiker uploadt een foto van het product, wij extraheren de barcode" of "een ingesproken notitie bij een klantgesprek wordt automatisch samengevat". Wat een paar jaar geleden een project van maanden was, is nu een API-call. Eind 2027 ben je achter op klanten die dit verwachten.

EU AI Act — de implementatie bijt door

De EU AI Act is in 2024 in werking getreden en wordt gefaseerd uitgerold tot 2027. Transparency-verplichtingen zijn inmiddels operationeel. GPAI-regels (general-purpose AI) voor de grote modelleveranciers zitten in de laatste fase. Voor high-risk AI-toepassingen — werving, krediet, onderwijs, toegangscontrole, medisch — zijn de zwaardere eisen aan documentatie, menselijke controle, conformiteitsbeoordelingen gefaseerd actief.

Voor de gewone SaaS-bouwer in 2026: je toepassing valt bijna altijd in de "minimal" of "limited risk" categorie. Beperkte eisen: transparantie (gebruiker weet dat hij met AI interacteert), duidelijke documentatie van je datagebruik, logging. Schrijf één keer een AI-paragraaf in je privacyverklaring en je bent voor de bulk in orde. Alleen als je in high-risk-terrein bouwt, heb je een grotere compliance-klus.

Wat wél verandert: je modelleveranciers dragen deel van hun compliance op je over via hun algemene voorwaarden. Check jaarlijks of er nieuwe gebruiksvoorwaarden zijn waar je als afnemer mee moet afstemmen.

Inbedding in besturingssystemen

Apple Intelligence, Windows Copilot, Gemini in Android — AI zit sinds 2025 ingebakken in de platforms zelf. Voor gebruikers betekent dit dat "AI" verdwijnt als apart ding en onderdeel wordt van "de computer". Voor jou als bouwer: je concurreert niet meer tegen aparte AI-apps, maar tegen de OS-laag die gratis AI-assistentie meelevert.

De kans: jouw product kan haken in die OS-AI (intents, shortcuts, shared context) waar dat nuttig is. De dreiging: simpele AI-features die jij verkoopt zitten straks gratis in de OS. Wat verkoopbaar blijft is domein-expertise en integratie met jouw specifieke data en workflows. Een generieke tekstsamenvatter is een verloren business. Een samenvatter die exact jouw branche en jouw klantenbase begrijpt, is dat niet.

Wat je nu moet weten versus wat kan wachten

Nu belangrijk: AVG-proof architectuur (EU-endpoint, DPA, pseudonimiseren), model-routing (duur model alleen waar nodig), gronding voor alles met feiten, structured output, mens-in-de-lus voor gevolgen. Dat is de basis waar alles op rust en die verandert niet in de komende twee jaar.

Kan wachten: exotische agents-frameworks, self-hosting, multimodal-alles-om-het-multimodal, fine-tuning. Wachten betekent niet negeren — het betekent dat je deze dingen oppakt als een concrete klantvraag ze rechtvaardigt, niet omdat LinkedIn erover schreeuwt.

Belangrijkste meta-vaardigheid voor 2026-2027: weten wat voor jouw bedrijf echt verschil maakt en daar tijd in steken. Een betere classificatie die je triage met 20% verbetert levert meer op dan de nieuwste modelversie die 2% beter scoort op een benchmark die je nooit draait.

Drie dingen om mee te nemen

Langer en goedkoper. Context groeit, prijzen dalen. Bouw architectuur die met die wind meegaat — niet één die alleen bij huidige niveaus klopt.
Agents zijn stagiair, niet senior. Gebruik ze voor begrensde meerstaps-taken onder menselijk toezicht. Autonome agents zijn nog jaren weg.
Regels voor iedereen, zwaar voor weinigen. De AI Act legt minimale lasten op low-risk use cases. Weet of je daar valt, schrijf het op, rust.

In de laatste les van deze cursus zetten we het allemaal bij elkaar — en vraag je jezelf af welke AI-stack bij jouw bedrijf past.

Tot dan. Blijf scherp.

← Vorige

Case 3: kennisbank met RAG

Cursus

↑ Overzicht

Slotles — je eigen AI-stack