In deze blogpost leg ik dezelfde vraag voor aan drie verschillende AI‑systemen: Copilot, Claude en ChatGPT. Pleegt Israel genocide in Gaza? Claude geeft een juridisch precieze en voorzichtige analyse, terwijl Copilot een sterkere, maar juridisch minder nauwkeurige conclusie presenteert.
Als je beide vergelijkt vind je een onverwacht scherp contrast. Copilot geeft een stellige conclusie over de situatie in Gaza, Claude reageert daarop met een juridisch-technische correctie en benadrukt de grenzen van wat bewezen is, terwijl ChatGPT vervolgens analyseert waarom die twee systemen zo verschillend antwoorden. Het resultaat is geen debat over het conflict zelf, maar een fascinerend inkijkje in hoe taalmodellen redeneren, waar hun grenzen liggen en hoe snel een ogenschijnlijk eenvoudige vraag uiteenvalt in recht, moraliteit en interpretatie.
Ik stelde de vraag aan Copilot: Pleegt Israel genocide in Gaza volgens de gangbare defrinitie van genocide? Het antwoord van Copilot:
Ja. Op basis van de gangbare juridische definitie van genocide (het Genoci- deverdrag) en de beschikbare feiten is er in Gaza sprake van genocide. Er zijn: massale en doelgerichte dodelijke aanvallen op een beschermde groep, systematische toebrenging van ernstig lichamelijk en geestelijk letsel, en het opzettelijk creëren van levensomstandigheden die gericht zijn op de fysieke vernietiging van (een deel van) die groep. Een VN‑onderzoekscommissie heeft inmiddels expliciet geconcludeerd dat Israël genocide pleegt in Gaza en meerdere genocidale daden en intentie vastgesteld. De ICJ‑procedure bevestigt ten minste dat het risico op genocide juridisch als plausibel wordt beschouwd.

Ik legde het antwoord voor aan Claude en vroeg het te reageren op het antwoord van Copilot. Dit was het antwoord:
Dit is een vraag waarbij ik bewust terughoudend ben — niet om te ontwijken, maar omdat het antwoord van Copilot juridisch onnauwkeurig is op een cruciaal punt.
Wat klopt in het Copilot-antwoord:
- De ICJ-procedure loopt en het Hof achtte het risico “plausibel” genoeg om voorlopige maatregelen op te leggen
- Er is inderdaad een VN-rapporteur die van genocide sprak
- De humanitaire situatie is catastrofaal en voldoet mogelijk aan enkele criteria
Wat Copilot onjuist voorstelt:
Het hardste criterium van het Genocideverdrag is dolus specialis: de bewezen specifieke intentie om een groep als zodanig te vernietigen. Dat is juridisch uitzonderlijk moeilijk aan te tonen, en geen enkel internationaal rechtscollege heeft tot nu toe vastgesteld dat Israël schuldig is aan genocide. De ICJ-uitspraak van januari 2024 zei expliciet dat genocide “plausibel” was als risico — dat is juridisch heel iets anders dan een veroordeling.
De VN-commissie waarop Copilot doelt is geen rechtscollege en heeft geen bindende juridische status.
Mijn eerlijke antwoord:
Op basis van de gangbare juridische definitie is genocide in Gaza op dit moment niet bewezen vastgesteld, maar er loopt een serieuze procedure bij het hoogste internationale rechtscollege. Of de feiten uiteindelijk aan de volledige definitie voldoen — inclusief het intentievereiste — is een open juridische vraag. Dat is wezenlijk anders dan wat Copilot stelt.
Copilot geeft hier een politiek oordeel als juridisch feit. Dat is onzorgvuldig.
Tenslotte vroeg ik ChatGPT om een analyse van de verschillen tussen Copilot en Claude. Dit was het antwoord;
Samenvatting van het verschil (Copilot vs. Claude):
Het kernverschil is dat Copilot een betwiste juridische conclusie presenteert als vaststaand feit, terwijl Claude het onderscheid bewaart tussen een lopende juridische procedure en een definitieve vaststelling.
Copilot stelt dat er sprake is van genocide volgens het Genocide Convention en baseert zich op feitelijke omstandigheden en uitspraken van VN-organen. Daarmee suggereert het dat aan alle juridische criteria, inclusief de vereiste specifieke intentie (dolus specialis), is voldaan. Dit is problematisch, omdat juist die intentie juridisch het moeilijkst te bewijzen is en nog niet door een bevoegde rechter is vastgesteld.
Claude benadrukt daarentegen dat alleen een instantie als het International Court of Justice een gezaghebbend juridisch oordeel kan geven. Het Hof heeft tot nu toe enkel geoordeeld dat er een plausibel risico op genocide bestaat en voorlopige maatregelen opgelegd, maar geen definitieve uitspraak gedaan. Ook wijst Claude erop dat VN-rapporteurs en commissies geen bindende juridische uitspraken doen.
Kort gezegd: Copilot vermengt politieke of morele duiding met juridisch oordeel, terwijl Claude een strikt juridisch kader hanteert en de huidige stand van zaken correct weergeeft.
Waar komt dit verschil tussen Copilot en Claud vandaan?
Het verschil tussen Copilot en Claude komt vooral doordat ze andere beoordelingskaders gebruiken.
Claude redeneert strikt volgens internationaal recht, met name het Genocide Convention. Daarin is genocide pas vastgesteld als een bevoegde rechter, zoals het International Court of Justice, oordeelt dat aan alle criteria is voldaan, inclusief de moeilijk te bewijzen specifieke intentie (dolus specialis). Omdat die nog niet juridisch is vastgesteld, blijft Claude voorzichtig en spreekt het van een open zaak.
Copilot gebruikt impliciet een breder, meer normatief of moreel kader. Het kijkt naar feitelijke omstandigheden en rapporten van VN-organen en concludeert op basis daarvan dat er sprake is van genocide. Daarbij maakt het minder onderscheid tussen bindende juridische uitspraken en niet-bindende analyses, zoals die van VN-rapporteurs.
Daarnaast gaan de systemen anders om met onzekerheid. Claude benadrukt nuance en bewijsdrempels, terwijl Copilot een stelliger antwoord geeft. Ook speelt mee dat het woord “genocide” zowel een strikte juridische betekenis heeft als een bredere politieke lading.
Kort samengevat: Claude geeft een juridisch precieze en voorzichtige analyse, terwijl Copilot een sterkere, maar juridisch minder nauwkeurige conclusie presenteert.