In februari van dit jaar hadden we het hier in de commentaren op kloptdatwel.nl al over de biggenstudie van onderzoeker Irene Camerlink (WUR) e.a. Toevallig kwam deze onlangs weer onder mijn aandacht. In een dialoog via Twitter met de woordvoerder van de WUR, Simon Vink, voerde ik die studie op als voorbeeld van onderzoek, dat niet ‘waar’ kon zijn. Dit na aanleiding van opmerkingen van Vink in de Gelderlander, “Wetenschap draait om zorgvuldigheid. Wat je zegt moet waar zijn. Nooit publiceren zonder dat je hebt gecheckt en gedoublecheckt. Zo doen wij dat hier in Wageningen althans.” In dit artikel leg ik uit waarom één of enkele losse onderzoeken (‘random controlled trials’ , of RCT’s) naar homeopathie nooit voldoende kunnen zijn om de werkzaamheid van een individueel homeopathisch middel aan te tonen. Zelfs als uit zo’n RCT komt dat het homeopathische middel (het verum) het beter zou doen dan een placebo. Die conclusie berust op een denkfout.
Kort na die discussie met Vink nam een journalist contact met me op. Hij had nl. net een stukje in de Molenaar gelezen over dezelfde studie en na wat geGoogle, vond hij dat ik de biggenstudie had genoemd op Twitter.
Ik was er intussen ook achter gekomen waarom het weer ‘nieuws’ was: Irene Camerlink en Liesbeth Ellinger, de homeopathische dierenarts, waarmee Maarten Koller op de radio in discussie was, hebben de studie onlangs op een symposium gepresenteerd (17 sept. 2011). Als je een beetje zoekt op Internet vind je nu op allerlei sites aanhangers van homeopathie juichend berichten, dat het nu wetenschappelijk bewezen is dat homeopathie kan werken.
In die discussie met Vink had ik beargumenteerd dat zo’n Randomized Controlled Trial (RCT) als onderzoek naar homeopathie wetenschappelijk gezien bij voorbaat niets kon opleveren en daarom eigenlijk niet zou moeten worden uitgevoerd aan een zichzelf respecterende universiteit. Dat argument heb ik hieronder uitgewerkt. Het komt neer op eens heel precies kijken wat zo’n RCT nu eigenlijk inhoudt.
Randomized Controlled Trial
Zo’n onderzoek begint grofweg met de nulhypothese, vervolgens komt de proefopzet, de proef zelf, de resultaatopname, de data-analyse en ten slotte het trekken van conclusies. De nul-hypothese veronderstelt gewoonlijk dat er geen verschil is in werking van verum (het middel dat we willen onderzoeken) en placebo (een nepmiddel). Verwacht mag dan worden dat er bij een groep proefpersonen die het verum krijgt en een andere groep die het placebo krijgt, niet al te grote verschillen in resultaat zullen optreden.
Alleen als er uit het experiment een significant verschil blijkt tussen verumgroep en placebogroep, verwerpen we de nulhypothese. Als de verumgroep beter scoorde, kun je dan claimen dat het verum een werking heeft die beter is dan die van het placebo. Dit alles is wel onder voorbehoud dat het experiment netjes is opgezet, zodanig dat er geen andere factoren de groepen verschillend kunnen beïnvloeden. Dit wordt o.a. getracht te bereiken met (dubbele) blindering. En dan is er altijd nog het fenomeen van de ‘vals-positieve’ uitslagen…
Nu zijn er diverse RCT’s uitgevoerd met klassiek homeopathische middelen die een positief significant verschil laten zien voor de verum groep. Is de conclusie dat het homeopathische middel werkt gerechtvaardigd? Nee, zullen de sceptici beweren en meestal zal het ze niet veel moeite kosten om ergens een onvolkomenheid in de opzet of data-analyse aan te tonen, die het onderzoek ‘onderuit’ haalt (zie de commentaren op het eerder bericht op kloptdatwel.nl om een idee te krijgen van wat er mis gegaan kan zijn bij het onderzoek van Camerlink).
Mocht het niet lukken fouten te ontdekken is het altijd nog mogelijk om te wijzen op de mogelijkheid van een vals positief resultaat, een toevalligheid. Dat laatste voelt natuurlijk wat zwakker aan als argument, maar is op zich wel valide. De reden dat die meta-analyses van homeopathische trials worden uitgevoerd, hangt sterk samen met dat verschijnsel van vals positieven. Als je een berg onderzoeken bij elkaar veegt, blijken die paar toevallige positieve uitslagen meestal de te verwachte uitschieters.
Wat zit er fundamenteel mis bij die RCT’s en homeopathie?
Het echte probleem ligt in mijn ogen echter op een fundamenteler niveau: de nulhypothese die ik eerder formuleerde is niet compleet en zou eigenlijk moeten luiden “er is geen verschil in werking tussen verum en placebo én er is een wezenlijk verschil tussen verum en placebo”. Die toevoeging is in gewone trials zo triviaal dat er eigenlijk nooit bij stil wordt gestaan. Meestal is er gewoon sprake van twee chemisch verschillende stoffen, maar essentieel is dat het bestaan van het verschil in overeenstemming is met de kennis waar je van uit gaat. Het wetenschappelijk probleem met de klassieke homeopathie is nu echter juist dat dat veronderstelde verschil niet aangetoond kan worden en er eigenlijk ook niet kán zijn op grond van bestaande kennis.
Als het experiment wordt uitgevoerd en er is een positief significant resultaat moet de conclusie dus eigenlijk luiden “onder aanname dat er een wezenlijk verschil is tussen verum en placebo, werkt het verum beter dan het placebo” (nog steeds met inachtneming van eerder genoemde randvoorwaarden van goede proefopzet en mogelijk een vals positieve uitslag). Zolang je echter niet dat wezenlijke verschil tussen verum en placebo kunt aantonen, heeft die conclusie geen enkele betekenis!
Aanhangers van homeopathie zullen nu aanvoeren dat de wetenschap nog niet zo ver is om dat verschil te meten of zelfs dat de werking überhaupt buiten het bereik van de huidige wetenschappelijke kennis ligt. Dit is ook wat Camerlink naar voren brengt en bevestigde in een mailwisseling, die ik met haar had. Zij verwacht binnen niet al te lange tijd dat die onontdekte eigenschappen van hoogverdunde oplossingen bewezen zullen worden: “Dat het verschil in samenstelling tussen het verum en de placebo nog niet wetenschappelijk is aangetoond is naar mijn inziens slechts een kwestie van tijd. Via de natuurwetenschappen wordt steeds duidelijker dat structuur van water door behandeling kan veranderen zonder dat de fysieke samenstelling van water verandert.”
Totdat die ‘verwachting’ bewaarheid is geworden, mag je de oorzaak van het positieve resultaat niet aan het verschil verum/placebo toeschrijven. Het is eigenlijk nog safer om het aan verschil in letters op de spuitbusjes (‘A’ of ‘B’) toe te schrijven. Zo gauw je namelijk een niet meetbare invloed accepteert als verklaring, kun je net zo goed elke andere niet meetbare invloed aannemen als verklaring: ‘ik heb toevallig heel hard gebeden voor de verum-groep’ óf ‘er zijn marsmannetjes die een straal biofotonen hebben afgevuurd op de verum groep’ …
Sommigen zullen in het positieve resultaat van het experiment zélf ‘bewijs’ zien voor het verschillen van verum en placebo; een ontoelaatbare cirkelredenering, volgens mij. Ik heb gemerkt dat dat echter niet bij iedereen die ik dat voorlegde vanzelfsprekend is, maar een voorbeeld kan het denk ik, verduidelijken.
Stel, we doen een proef, waarbij we zeker weten dat verum en placebo identiek zijn. We nemen bijvoorbeeld kraanwater of nog makkelijker, ‘niets’. Nu kan het experiment toch een significant positief resultaat opleveren voor het ‘verum’, door problemen met de opzet of door toeval (vals positief). In dat geval zal geen wetenschapper de conclusie trekken dat de twee identieke middelen blijkbaar tóch verschillend waren, of dat het verum-’niets’ anders was dan het placebo-’niets’.
Kortom, zolang er vooraf geen wetenschappelijk aanvaardbaar verschil is aan te tonen tussen verum en placebo, kan de conclusie bij een positief significant resultaat van een RCT alleen maar zijn dat, ofwel er onvolkomenheden in de opzet zaten, ofwel dat we met een vals positief resultaat van doen hebben. Het is eigenlijk niet nodig om verder te kijken. De conclusie dat het verschil veroorzaakt wordt door een betere werking van het verum is echter bij voorbaat onjuist, of leunt op zijn minst op de veel zwaardere claim van het bestaan van onbekende krachten, of iets dergelijks.
En je moet je afvragen of het wetenschappelijk verantwoord is, om zo’n positief resultaat zonder al die voorbehouden die op zijn plaats zijn, te publiceren. Ik vind eigenlijk dat je dat niet moet doen en in mijn ogen zou het Wageningen sieren om duidelijk afstand te nemen van die studie (en eens uit te leggen waarom ze er ooit aan begonnen zijn). De WUR heeft jammer genoeg ook nooit gereageerd op de nominatie voor de Meester Kackadorisprijs 2010 naar aanleiding van de biggenstudie.
Wat blijft er dan wel aan bewijsmogelijkheden over voor homeopathie?
Fundamenteel onderzoek naar homeopathie wijs ik niet bij voorbaat af, hoewel er zo weinig aanwijzingen voor de werking ervan zijn, dat ik het eigenlijk niet acceptabel vind dat er gemeenschapsgeld aan wordt besteed. Zo’n aanwijzing zou kunnen bestaan, het klinkt misschien een beetje paradoxaal na het voorafgaande, uit een goed opgezette RCT, die bij herhaling en ook bij herhalingen door andere onderzoekers, keer op keer een positief significant resultaat laat zien. Buitengewone claims vergen immers buitengewoon sterk bewijs. Op het Skepsis-blog zijn andere suggesties te vinden .
De huidige ophef over die neutrino’s laat zien hoe verstandige wetenschappers omgaan met onverklaarde resultaten, die de huidige wetenschappelijke kennis lijken te tarten: eerst zelf alles tot in den treure controleren en herhalen, en als het resultaat nog steeds overeind blijft, aan je collega’s vragen om de proef te herhalen en jouw resultaten kritisch te bekijken. Sommige critici vinden het eigenlijk al te ver gaan dat CERN er een persconferentie over belegde…Voorzichtigheid over de eigen resultaten en speculaties over mogelijke gevolgen voor de wetenschap bij bevestiging van het resultaat nuanceren, lijkt mij de wetenschappelijk juiste houding. Zo’n merkwaardig resultaat is alleen maar het beginpunt van een zoektocht naar een verklaring.
Conclusie: losse RCT’s zijn bij voorbaat zinloos om op een wetenschappelijk verantwoorde manier de werking van homeopathische middelen aan te tonen … En, denk ik vervolgens, zijn al die meta-analyses van die trials door sceptici die nu als belangrijkste reden worden aangevoerd om maar op te houden met het onderzoek naar homeopathie, dan eigenlijk ook niet overbodig geweest?