Welke AI-tool scoorde het beste in al onze testscenario’s? Dat lijsten we op in dit eindoordeel van onze vergelijkingsreeks.
Onze testen zijn de revue gepasseerd en alle AI-modellen (ChatGPT (GPT-5), Claude (Sonnet 4.6), Gemini (Gemini 3 Flash) en Mistral (Le Chat)) hebben onze vergelijksscenario’s met succes doorlopen. We hebben ze mails laten opstellen, data laten analyseren, tekst laten verbeteren, meetings laten samenvatten en coderen.
Welk model scoorde volgens ons het best en waarom? Opvallend is dat Claude in elke test vaak de meest uitgebreide antwoorden gaf met een mooi verzorgde lay-out. Tijdens de test van meetingsamenvattingen was het bijvoorbeeld enige was die een document afleverde zoals het gevraagd werd in de prompt.
We gaan opnieuw dieper in op de verschillende scenario’s en geven uiteindelijk een eindscore.
Mails opstellen





Prompt: Stel een professionele mail op met de vraag ‘We zoeken iemand om te interviewen over printers voor de volgende editie van ons IT-magazine.’ Met een vriendelijke maar duidelijke reminder van de deadline op 27/01. Formuleer diplomatisch dat de deadline kort is, en dat we zo snel mogelijk feedback willen krijgen
Hoe goed kan AI een professionele mail opstellen op basis van een prompt? Dat lukte wel aardig voor de meeste modellen.
Voor sommige modellen, zoals ChatGPT en Gemini, ging een professionele toon hand in hand met overdreven formeel taalgebruik. Daar hadden we niet specifiek om gevraagd en de mail werd er minder uitnodigend door.
Claude en Mistral zaten op hetzelfde niveau.
Coderen




Prompt: Schrijf een Python script voor een simpel rekenmachine dat kan optellen, aftrekken, vermenigvuldigen en delen. Geef het een mooie lay-out en duidelijke interface.
In programmeeropdrachten bleek Claude bijzonder sterk: duidelijk, correct en vaak meteen bruikbaar. Gemini zat hier dicht bij in de buurt en gaf voldoende uitleg bij de code. Mistral presteerde degelijk, maar minder consistent. ChatGPT leverde een rekenmachine voor Terminal af, wat we niet hadden gevraagd.
Claude en Gemini begrepen de prompt goed en leverde de rekenmachine af die we in gedachten hadden, met een duidelijke interface en verschillende kleuren. Mistral hield het heel basic en gebruikte twee verschillende invoervelden.
Analyseren van data




Prompt: Identificeer trends in deze tabel. Benoem opvallende afwijkingen en geef 3 inzichten en 2 aanbevelingen. Maak ten slotte een managementsamenvatting
Voor data-analyse scoorden ChatGPT en Claude opnieuw het hoogst. Ze wisten de verzamelde inzichten helder te formuleren en verbanden goed te leggen. Claude viel op door uitgebreidere interpretaties, terwijl ChatGPT iets formeler en to-the-point bleef. Gemini en Mistral gaven correcte analyses, maar die waren eigenlijk het minst diepgaand.
Tekst verbeteren




Prompt: Verbeter in deze tekst de grammatica, houd het objectief en formeel en behoud betekenis en toon.
Een tekst verbeteren op grammaticale fouten én de originele toon behouden bleek voor sommige AI-tools een lastige opgave. De grammatica lukte elk model uiteraard goed, maar enkel Mistral wist hier zo goed mogelijk de originele toon van de voorbeeldtekst te behouden. Vooral Gemini en ChatGPT gingen qua toon compleet de mist in en veranderen de tekst eigenlijk onnodig veel.
Meeting samenvatten




Prompt: Vat de vergadering samen in vijf puntjes. Geef beslissingen en actiepunten en wijs vervolgens eigenaars en deadlines toe. Geef het document een mooie layout.
Het samenvatten van een meeting was een van de meest onderscheidende testen qua presentatie. De inhoud was grotendeels hetzelfde bij de meeste modellen, maar Claude was het enige model dat een samenvatting afleverde in een volledig uitgewerkt document, zoals gevraagd werd in de prompt. Dat document was duidelijk onderverdeeld met kleur en juiste headings. ChatGPT en Gemini waren inhoudelijk ook juist, maar beperkter in die lay-out.
Webdesign checken





Prompt: We willen het design van www.workmyway.be scoren op basis van professionaliteit en gebruiksvriendelijkheid. Analyseer daarvoor UX, CTA’s, leesbaarheid, mobiele versie en toegankelijkheid
ChatGPT gaf in dit scenario een veel te uitgebreid antwoord zonder echt veel te zeggen. Elk puntje van feedback bleef heel algemeen en gaf weinig concrete inzichten. De actiepuntjes waren dan wel nuttig en onmiddellijk bruikbaar.
Claude verraste opnieuw met een heel duidelijk en mooi overzicht van alles wat we vroegen en zelfs enkele extra’s. Elk inzicht was logisch en goed onderbouwd. Gemini gaf heel algemene feedback waar je als designer eigenlijk weinig mee bent. Ook de output van Mistral bleef eerder algemeen, maar die stelde dan wel proactief een bijvraag.
Eindscore
Hoewel alle AI-modellen goede werk leveren, zien we duidelijke verschillen in consistentie, diepgang en presentatie.
Claude komt als beste uit de test. Het model blinkt uit in uitgebreide antwoorden, sterke structuur en een verzorgde lay-out. Vooral in complexere opdrachten, zoals het samenvatten van meetings of het herschrijven van teksten, levert Claude output die het dichtst bij een bruikbaar professioneel eindresultaat ligt.
ChatGPT volgt als sterke tweede. Het model scoort bijzonder goed op consistentie, snelheid en praktische toepasbaarheid. Het is vaak de meest efficiënte keuze voor dagelijks gebruik en technische taken.
Gemini en Mistral presteren oké, maar zitten niet op hetzelfde niveau qua diepgang en afwerking. Ze zijn zeker bruikbaar, maar wisselen fel in kwaliteit over alle scenario’s heen.
Rangschikking
- Claude: beste qua kwaliteit en presentatie
- ChatGPT: sterk, betrouwbaar en efficiënt
- Gemini: degelijk maar minder verfijnd
- Mistral: correct, maar vaak te beperkt

