INDRODUZIONE
Nella ricerca clinica, la definizione della dimensione campionaria per uno studio clinico è uno degli aspetti più importanti per il successo dello studio stesso.
La dimensione del campione deve essere calcolata correttamente durante la fase di progettazione dello studio clinico, perché è una fase fondamentale da diversi punti di vista, tra cui quello metodologico, etico e finanziario.
Lo scopo di questo articolo è presentare la definizione di “dimensione del campione”, descrivere tutte le assunzioni e le ipotesi alla base del calcolo e discutere del perché il calcolo della dimensione del campione è così importante per il successo della ricerca clinica.
COS’È LA DIMESIONE CAMPIONARIA?
La dimensione campionaria è il numero di soggetti da includere in uno studio clinico che consentirà di rilevare un effetto del trattamento clinicamente rilevante (cioè un risultato del trattamento che generalmente i medici considerano importante).
L'obiettivo principale di uno studio clinico, infatti, è dimostrare che un trattamento sperimentale abbia un buon profilo di sicurezza e un determinato effetto sulla popolazione di interesse, ovvero un gruppo omogeneo affetto da una determinata malattia con una certa gravità.
Poiché non è possibile reclutare l'intera popolazione, affetta, ad esempio, da una determinata malattia o che deve essere trattata con il trattamento sperimentale, sarà arruolato nello studio un sottogruppo di individui che rappresenti la popolazione complessiva.
per calcolare la dimensione del campione più appropriata da arruolare in uno studio clinico è di fondamentale importanza la collaborazione tra biostatistici e clinici è importante.
QUALI SONO GLI ELEMENTI CHIAVI PER IL CALCOLO DELLA DIMENSIONE CAMPIONARIA?
Il calcolo della dimensione del campione dipende dalle ipotesi statistiche prestabilite e dai seguenti presupposti:
- Endpoint primario: l'endpoint primario dello studio è un aspetto fondamentale del calcolo della numerosità campionaria, poiché la metodologia statistica che verrà applicata per stimare tale calcolo dipende dalla natura di esso (cioè endpoint continuo, categorico o tempo dipendente). Inoltre, il test statistico che verrà applicato durante l'analisi finale dell'endpoint primario dovrebbe essere lo stesso considerato nelle ipotesi di calcolo della dimensione del campione (ad esempio, se l'analisi primaria si baserà su un test Chi-quadro tra due gruppi indipendenti, lo stesso test statistico dovrebbe essere stato considerato durante il calcolo della dimensione del campione).
- Numero di gruppi di trattamento coinvolti: la scelta della metodologia statistica (test indipendente o a coppie, ecc.) da applicare per il calcolo della dimensione del campione dipende dal numero di gruppi di trattamento coinvolti nell'indagine clinica.
- Errore di tipo I (alfa): è il rifiuto dell'ipotesi nulla vera (cioè nessuna differenza tra gli effetti di due trattamenti). La probabilità dell'errore di tipo I (α), chiamato anche livello di significatività, misura la probabilità di rifiutare l'ipotesi nulla quando questa è vera (cioè di concludere che la differenza tra gli esiti di due trattamenti è statisticamente significativa quando non lo è). In altre parole, si parla di risultati falsi positivi e si esprime con il valore p. Per convenzione, il livello alfa è fissato a 0.05, il che significa che è tollerabile avere il 5% di probabilità di rifiutare erroneamente l'ipotesi nulla. Quanto più basso è l'errore alfa, tanto più grande sarà la dimensione del campione richiesta.
- Errore di tipo II (beta): è il mancato rifiuto dell'ipotesi nulla falsa. Il tasso di errore di tipo II è indicato con β e misura la probabilità di non rifiutare l'ipotesi nulla, quando questa è falsa (cioè di concludere che non c'è differenza tra i risultati di due trattamenti quando invece c'è una differenza). In altre parole, si riferisce ai risultati falsi negativi. Per convenzione, il livello di beta è fissato a 0.20, il che significa che è tollerabile avere una probabilità del 20% di conclusioni falso-negative.
- Potenza: è il complementare di β (cioè 1- β) e rappresenta la probabilità desiderata di osservare la differenza attesa tra gli esiti di due trattamenti, se vera, al livello di significatività α (cioè la probabilità di rifiutare correttamente l'ipotesi nulla quando è falsa). Per convenzione, la potenza è impostata a 0.80, il che significa che la probabilità di rifiutare correttamente l'ipotesi nulla è almeno dell'80%. Maggiore è la potenza, maggiore sarà la dimensione del campione richiesta.
- Differenza minima significativa rilevabile: è la più piccola differenza tra i trattamenti considerati clinicamente rilevante per la gestione dei soggetti o per il giudizio sull'effetto atteso di un nuovo trattamento (cioè, la differenza tra gli esiti di due trattamenti che i ricercatori dello studio considerano biologicamente plausibile e rilevante dal punto di vista clinico). Quanto più grande è questa differenza attesa, tanto più piccola sarà la dimensione del campione richiesta.
- Variabilità della misura: è una misura della dispersione dei punti dati in una popolazione specifica. Può essere ottenuta esaminando la letteratura pubblicata o da studi pilota, ma ciò non è sempre fattibile. Nei casi in cui la variabilità dell'esito non è nota, si deve ricorrere a una stima e ad un'attenta simulazione. Maggiore è la variabilità attesa nell'esito specificato, maggiore sarà la dimensione del campione richiesta.
- Tasso di abbandono: è la percentuale prevista di soggetti che possono abbandonare lo studio per qualsiasi motivo. Normalmente, il calcolo della dimensione del campione indica il numero di soggetti da analizzare per raggiungere la significatività statistica per una determinata ipotesi. Pertanto, nella pratica clinica, potrebbe essere necessario arruolare più soggetti per compensare questi potenziali abbandoni. Data n la dimensione stimata del campione e d il tasso di abbandono, la dimensione totale del campione da arruolare nello studio, secondo la formula di Freedman, è:
N=n/(1-d⁄100)
PERCHÈ LA DIMENSIONE CAMPIONARIA È COSÌ IMPORTANTE?
Il calcolo della dimensione appropriata del campione è un aspetto importante per le indagini cliniche, al fine di evitare il verificarsi di due situazioni:
- Studi sottopotenziati: sono studi che hanno un'alta probabilità di mancare gli obiettivi dello studio, a causa di una dimensione del campione troppo piccola. Uno studio clinico sottopotenziato non ha la potenza necessaria per rispondere chiaramente al quesito clinico ed evidenziare l'effetto benefico di un nuovo intervento a scapito di soggetti futuri. Ciò può portare a conclusioni improprie, negative o incerte, dello studio. Inoltre, non sarebbe etico esporre gli individui, anche se pochi, a rischi inutili e non necessari: l'incertezza associata alla ricerca clinica (ad esempio, eventi avversi gravi o un trattamento meno efficace) vale solo se c'è una reale possibilità di ottenere risultati conclusivi.
- Studi sovra potenziati: sono studi con una dimensione del campione eccessivamente grande. Uno studio sovra potenziato può richiedere inutilmente tempo, essere costoso e non etico, poiché priva alcuni dei pazienti di un trattamento superiore. Inoltre, campioni troppo grandi (studi sovradimensionati) possono portare a differenze statisticamente significative che non sono effettivamente di interesse clinico.
Infine, ma non meno importante, le Autorità Sanitarie (come anche le riviste ad alto impatto) richiedono un calcolo formale della dimensione del campione per gli studi di conferma. Inoltre, una giustificazione della dimensione del campione è richiesta anche per gli studi non pivotali, qualora non fosse possibile fornire una dimensione del campione basata sulla potenza.
CONCLUSIONE
In conclusione, il calcolo della dimensione del campione è il primo e uno dei passi più importanti nella pianificazione di uno studio clinico e qualsiasi negligenza nella sua stima può portare al rifiuto di un trattamento efficace e all'approvazione di un trattamento inefficace. Sebbene le tecniche per il calcolo della dimensione del campione siano descritte in vari libri di statistica, l'esecuzione di questi calcoli può essere complicata ed è auspicabile consultare un biostatistico esperto nella stima di questo parametro vitale dello studio.
RIFERIMENTI E NOTE
- Andrade C. Sample Size and its Importance in Research. Indian J Psychol Med. 2020 Jan 6;42(1):102-103. doi: 10.4103/IJPSYM.IJPSYM_504_19. PMID: 31997873; PMCID: PMC6970301.
- Biau DJ, Kernéis S, Porcher R. Statistics in brief: the importance of sample size in the planning and interpretation of medical research. Clin Orthop Relat Res. 2008 Sep;466(9):2282-8. doi: 10.1007/s11999-008-0346-9. Epub 2008 Jun 20. PMID: 18566874; PMCID: PMC2493004.
- Faber J, Fonseca LM. How sample size influences research outcomes. Dental Press J Orthod. 2014 Jul-Aug;19(4):27-9. doi: 10.1590/2176-9451.19.4.027-029.ebo. PMID: 25279518; PMCID: PMC4296634.
- Fogel DB. Factors associated with clinical trials that fail and opportunities for improving the likelihood of success: A review. Contemp Clin Trials Commun. 2018 Aug 7;11:156-164. doi: 10.1016/j.conctc.2018.08.001. PMID: 30112460; PMCID: PMC6092479.
- Gupta KK, Attri JP, Singh A, Kaur H, Kaur G. Basic concepts for sample size calculation: Critical step for any clinical trials! Saudi J Anaesth 2016;10:328-31.
- ICH (International Council for Harmonisation of Technical Requirements for Human Use) Topic E 9 Statistical Principles for Clinical Trials. Chapter 3.5.
- Martínez-Mesa J, González-Chica DA, Bastos JL, Bonamigo RR, Duquia RP. Sample size: how many participants do I need in my research? An Bras Dermatol. 2014 Jul-Aug;89(4):609-15. doi: 10.1590/abd1806-4841.20143705. PMID: 25054748; PMCID: PMC4148275.
- Noordzij M, Tripepi G, Dekker FW, Zoccali C, Tanck MW, Jager KJ. Sample size calculations: basic principles and common pitfalls. Nephrol Dial Transplant. 2010 May;25(5):1388-93. doi: 10.1093/ndt/gfp732. Epub 2010 Jan 12. Erratum in: Nephrol Dial Transplant. 2010 Oct;25(10):3461-2. PMID: 20067907.
- Nyirongo VB, Mukaka MM, Kalilani-Phiri LV. Statistical pitfalls in medical research. Malawi Med J. 2008 Mar;20(1):15-8. doi: 10.4314/mmj.v20i1.10949. PMID: 19260441; PMCID: PMC3345655.
- Wang X, Ji X. Sample Size Estimation in Clinical Research: From Randomized Controlled Trials to Observational Studies. Chest. 2020 Jul;158(1S):S12-S20. doi: 10.1016/j.chest.2020.03.010. PMID: 32658647.