Onderzoeksopzet en statistische toetsen

Publicatiedatum: 5 mei 2020
Auteur: Lidwien Smabers, 5e-jaars geneeskundestudent, VGT-score: 55%

Onderzoeksopzet en statistische toetsen

Statistiek is natuurlijk het favoriete onderwerp van iedere geneeskundestudent. Om het nog leuker, maar vooral makkelijker te maken vind je in dit artikel een overzicht om de verschillende statistische toetsen en onderzoeksvormen wat beter te begrijpen. Het kiezen van het geschikte onderzoeksopzet en de juiste statistische toets is niet eerder zo makkelijk geweest!

Meer weten over sensitiviteit en specificiteit? Bekijk dan dit leerartikel.

Kernpunten

Kies de meest geschikte toets van jouw dataset aan de hand van het volgende stappenplan:
1. Welk meetniveau wordt gebruikt (numeriek of categorisch)?
2. Hoeveel groepen worden vergeleken?
Kies de meest geschikte analyse aan de hand van het volgende stappenplan:
1. Welk meetniveau wordt gebruikt (numeriek of categorisch)?
2. Zijn de data normaal verdeeld?
3. Tussen hoeveel variabelen wil je een verband aantonen?
Kies je onderzoeksopzet aan de hand van het doel van je vraagstelling. Wil je:
1. de prevalentie van een ziekte bepalen? Kies dan de cross-sectionele studie;
2. het verband onderzoeken tussen een risicofactor en een ziekte? Kies dan voor een cohort- of patiëntcontrolestudie;
3. het effect van een interventie onderzoeken? Kies dan de randomized controlled trial (RCT).

Wanneer je in een onderzoek een vergelijking doet, is de uitdaging om de juiste toets te kiezen. Wanneer je op zoek bent naar een bepaald verband of een associatie, is de uitdaging om de juiste analyse te kiezen.

De juiste toets kiezen

Om de keuze te maken welke toets je het best kunt gebruiken is het belangrijk eerst na te gaan wat voor meetniveau gebruikt wordt en hoeveel groepen worden vergeleken. Het meetniveau kan numeriek (continu) of categorisch (discreet) zijn. Bij continue variabelen kan elke waarde tussen twee meetpunten voorkomen.

Categorische data worden ingedeeld in klassen of categorieën. Een dichotome/binaire categorische variabele kan slechts twee mogelijke waarden aannemen. Op ordinaal meetniveau is sprake van een ordening in de getallen, op nominaal meetniveau zijn de categorieën willekeurig. Data zijn gepaard als er tweemaal of meermaals bij dezelfde persoon een meting is gedaan. Als er sprake is van onafhankelijke groepen, zijn de data ongepaard.

Voorbeelden van meetniveaus

Numerieke (continue) data: aantal koppen koffie, temperatuur, lichaamslengte
Binaire categorische data: overgewicht/geen overgewicht
Nominale categorische data: woonplaats
Ordinale categorische data: opleidingsniveau

Wanneer gebruik je een…

one-sample t-toets: bij 1 groep en normaal verdeelde numerieke data;
gepaarde t-toets: bij 2 gepaarde groepen en normaal verdeelde numerieke data;
ongepaarde t-toets: bij 2 ongepaarde groepen en normaal verdeelde numerieke data;
ANOVA: bij meer dan 2 ongepaarde groepen en normaal verdeelde numerieke data;
Wilcoxon signed rank toets: bij 2 gepaarde groepen en niet-normaal verdeelde ongepaarde data;
Mann-Whitney U-toets: bij 2 ongepaarde groepen en niet-normaal verdeelde ongepaarde data;
Z-test: bij 1 groep en binaire data;
Chi-kwadraat toets: bij 2 of meer ongepaarde groepen en categorische (binair, norminaal of ordinaal) data;
Fisher’s exact toets: bij 2 of meer ongepaarde groepen en categorische (binair, norminaal of ordinaal) data en lage aantallen in de 2×2 tabel (zie tabel 1).

Toetsen kunnen worden ingedeeld in parametrisch en non-parametrisch. Bij een parametrische toets moet sprake zijn van een normale verdeling. Indien je een parametrische toets wilt vervangen door een non-parametrische toets kan dat als volgt:

De Wilcoxon signed rank toets kan het beste een gepaarde t-toets vervangen.
De Mann-Whitney U-toets is ter vervanging van een ongepaarde t-toets.

Voorbeeld van een toetskeuze

Je wilt een statistische toets kiezen voor een onderzoek waarin je het aantal zituren per week wilt vergelijken tussen een groep patiënten met hypertensie en een groep patiënten zonder hypertensie. Hoe pak je dit aan? Gebruik daarvoor dit twee-stappenplan:

Hoeveel groepen worden vergeleken? Er is sprake van ene groep patiënten met en een groep zonder hypertensie, dus twee groepen worden vergeleken.
Welk meetniveau is gebruikt? Het aantal zituren per week kan elke waarde tussen twee meetpunten (0 en 168) aannemen. Er is dus sprake van numerieke data.

De juiste analyse kiezen

Voor de keuze van het type analyse geldt hetzelfde als voor de keuze van het soort toets: bepaal eerst het meetniveau van de data. Daarna moet worden nagegaan of de data normaal verdeeld is en tussen hoeveel variabelen je een verband wilt aantonen.

Bij cross-sectioneel (transversaal) onderzoek wordt ieder individu in een groep op hetzelfde tijdstip gemeten. Bij longitudinaal onderzoek worden de metingen op verschillende tijdstippen gemeten. Voorbeelden van analyses die worden gebruikt bij longitudinaal onderzoek zijn Kaplan Meier, Cox regressie en repeated measures ANOVA.

Wanneer gebruik je een…

enkelvoudige lineaire regressie: indien je bent geïnteresseerd in de mate van samenhang tussen twee variabelen en de data numeriek en normaal verdeeld is;
meervoudige lineaire regressie: indien je bent geïnteresseerd in de mate van samenhang tussen meerdere variabelen en de data numeriek en normaal verdeeld is;
Spearman’s rho: indien je bent geïnteresseerd in de mate van samenhang tussen twee variabelen en de data numeriek maar niet normaal verdeeld is;
Kaplan-Meier: indien de data informatie geeft over de tijd tot het optreden tot een bepaald event en er sprake is van één voorspellende factor die de overleving beïnvloedt;
Cox regressie: indien de data informatie geeft over de tijd tot het optreden tot een bepaald event en er sprake is van meerdere voorspellende factoren die de overleving beïnvloeden;
odds ratio, relatief risico, attributief risico, number needed to treat: indien je bent geïnteresseerd in de mate van samenhang tussen twee variabelen met twee uitkomstcategorieën;
logistische regressie: indien je bent geïnteresseerd in de mate van samenhang tussen meerdere variabelen met twee uitkomstcategorieën;
repeated measures ANOVA: indien sprake is van herhaalde metingen van een continue, normaal verdeelde uitkomstmaat.

Onderzoeksopzet

Bovenaan de hiërarchie van bewijsvoering (‘piramide van evidence’) staat de randomized controlled trial (of een meta-analyse daarvan). Daarna volgt in rangorde van hoge naar lage bewijskracht de cohortstudie, de patiënt-controlestudie, de cross-sectionele studie en vervolgens case-reports of case-series.

Cross-sectionele studies worden voornamelijk gebruikt om na te gaan wat op een bepaald tijdstip de prevalentie van een bepaalde ziekte is. Een cross-sectioneel onderzoek is een observationeel onderzoek waarbij de onderzoeker geen interventie uitvoert (zoals medicatietoediening of een operatie).
Een cohortstudie is geschikt voor een prognostische onderzoeksvraag. Cohortstudies worden groepen die wel of niet zijn blootgesteld aan een risicofactor langere tijd opgevolgd en vergeleken. Op het moment van aanvang van het onderzoek moet de onderzochte populatie nog vrij zijn van de onderzochte uitkomst. Een onderscheid kan worden gemaakt tussen prospectieve en retrospectieve cohortstudies.
Een patiënt-controlestudie is een onderzoek uitgaande van personen met de bestudeerde ziekte of aandoening waarbij een controlegroep wordt geselecteerd van personen zonder de bestudeerde ziekte of aandoening. Vervolgens wordt per groep vastgesteld hoeveel personen in elk van deze groepen tevoren blootgesteld is geweest aan de bestudeerde determinant(en). De voordelen van een patiëntcontrole onderzoek zijn dat het vaak snel kan worden uitgevoerd en de kans op loss to follow up laag is.
Een RCT is erg geschikt bij een onderzoeksvraag die het effect nagaat van een vorm van therapie. De voordelen van een RCT zijn dat de kans op selectiebias, confounding en information bias laag zijn.
Bij een interventieonderzoek kan gebruik gemaakt worden van een cross-over design of van een parallel design.
- Crossover design: Elke respondent behoort in een bepaalde periode tot de interventiegroep en gedurende een andere periode tot de controlegroep. Elke deelnemer krijgt in opeenvolgende perioden alle behandelingen, waarbij de uitkomsten gemeten worden aan het eind van elke periode.
- Parallel design: Twee groepen worden vergeleken waarbij deelnemers worden gerandomiseerd in één van beide groepen.

Systematische review versus meta-analyse

Een systematische review is transparant en reproduceerbaar en gaat uit van een expliciete vraagstelling, een uitgebreide zoekstrategie, een ondubbelzinnige procedure voor selectie van onderzoeken, een beoordeling van de kwaliteit van de onderzoeken en een transparante presentatie van de resultaten. Een systematische review geeft een overzicht van de stand van zaken van medisch-wetenschappelijk onderzoek. Een meta-analyse is een systematische review én een kwantificering van de resultaten, waarbij de afzonderlijke resultaten worden gecombineerd tot een overall schatting van bijvoorbeeld het effect van de bestudeerde interventie.

Voorbeelden van onderzoeksdesigns

Cross-sectioneel onderzoek: Een onderzoek naar de prevalentie van overgewicht.
Cohortstudie: Een retrospectieve studie waarin alle medewerkers van een ziekenhuis worden meegenomen en men terug in de tijd kijkt om het verband te achterhalen tussen het blootgesteld zijn aan een schadelijke stof en het ontwikkelen van een bepaalde ziekte.
Patiënt-controlestudie: Een studie waarin bekeken wordt hoeveel personen in een groep met hart- en vaatziekten hebben gerookt en hoeveel personen in een groep zonder hart- en vaatziekten hebben gerookt.
RCT: Een studie naar het effect van een gastric bypass-operatie versus een maagsleeve op overgewicht.
Systematische review: Een samenvatting van de bekende literatuur over het effect van een gastic bypass-operatie versus een maagsleeve op overgewicht.
Meta-analyse: Een statistische analyse waarbij de samengevatte resultaten van verschillende studies over het effect van een gastic bypass-operatie versus een maagsleeve op overgewicht gecombineerd worden tot een ‘overall’ resultaat.

Verschil tussen cohort- en patiëntcontrolestudie

Bij een cohortstudie wordt een groep die blootgesteld is aan een risicofactor vergeleken met een groep die niet is blootgesteld aan die risicofactor op het ontwikkelen van een ziekte. Hierbij worden de groepen dus gemaakt op basis de wel of niet aanwezige blootstelling aan een risicofactor. Bij een patiënt-controlestudie daarentegen wordt bekeken hoeveel patiënten met en hoeveel patiënten zonder een bepaalde ziekte zijn blootgesteld aan een risicofactor. Hierbij worden de groepen dus juist gemaakt op basis van een uitkomstmaat (wel of niet ziek).