Il Valore P è uno dei valori più importanti nella ricerca, ma è un concetto impegnativo da comprendere. Cos’è veramente un Valore P?

Valore P: il Valore P o il valore di probabilità è realisticamente il valore più importante nella scienza. Che ci crediate o no, l’approvazione di farmaci che valgono milioni (forse miliardi) di euro o trattamenti che possono salvare migliaia di persone alla fine si riducono a questo piccolo Valore p. Di solito puoi trovarli nell’abstract o nella sezione dei risultati di uno studio.

L’immagine qui sotto mostra il risultato del famoso studio di Doll e Hill del 1956. Lo studio ha dimostrato che il fumo provoca effettivamente il cancro ai polmoni, salvando così milioni di vite.

Perché abbiamo bisogno di un valore p?

Dato che ora conosci l’importanza di un Valore p, perché ne abbiamo davvero bisogno?

Esempio di studio: facciamo un esempio di studio in cui un ricercatore vuole conoscere il peso medio degli abitanti del pianeta Marte. Immaginiamo che la popolazione totale di questo pianeta sia composta da 10 persone e il peso medio della popolazione sia di 150 chili.

Seleziona casualmente un campione di 3 persone.

Ottiene una media di 137 chili. E proclama che il peso medio della popolazione su Marte è di 137 chili.
Ora, per confermare il suo studio iniziale, prende altre 3 persone dalla popolazione di 10. Indovina un pò, ora ottiene un valore medio di 140 chili.
Prende ancora un altro campione di 3 persone in modo casuale. Ora ottiene un valore di 147 chili. Ora il ricercatore è davvero confuso. Perché stiamo ottenendo numeri diversi? La scienza ha fallito?

Errore di campionamento: questi numeri diversi o “vaganti” sono dovuti alla selezione di campioni diversi dalla popolazione. E quindi è chiamato errore di campionamento. Errore in latino significa “vagare”. Quindi la domanda è: come possiamo dire con sicurezza che il risultato di ogni studio è dovuto al nostro intervento e non a errori di campionamento? O, in altre parole, come possiamo dire che non è dovuto al “caso”?

E questo è esattamente il motivo per cui abbiamo bisogno del Valore p: vogliamo sapere se i nostri risultati sono dovuti all’intervento o a causa di questi errori di campionamento o “possibilità”. In breve, il Valore P è il modo per affrontare il problema degli errori di campionamento quando si tenta di dedurre qualcosa su una popolazione. Quindi ogni volta che ascolti il valore P, pensa a un errore di campionamento.

Quindi, come funziona questo Valore P?

Ora arriva la domanda da un milione di dollari; ma come mai il Valore P sa quando i risultati sono dovuti a errori di campionamento o all’intervento umano? Prendiamo uno scenario personale di perdita di peso: immagina di provare a perdere peso con una nuova dieta. Una mattina sali sulla bilancia e la bilancia dice che hai perso 1 chilo e continui con le tue cose quotidiane. Qualche settimana più tardi saliti sulla bilancia e ora mostra che hai perso 2 chili e continui con la tua routine quotidiana. Poche settimane dopo, passi sulla bilancia e ora hai perso 5 chili!! All’improvviso sei così eccitato e dici a tutti i tuoi amici e le persone al lavoro che la dieta per perdere peso funziona!

Ora la domanda è: perché eri così eccitato per la perdita di 5 chili, ma non ti fregava niente della perdita di 1-2 chili? Perché? La risposta è che stai usando il tuo “Valore P” o la tua probabilità confrontando i tuoi numeri di perdita di peso con un grafico di distribuzione personale che hai nella tua testa. Allora, cos’è questo grafico di distribuzione personale?

Grafico di distribuzione personale: questo grafico di distribuzione personale riflette la probabilità delle tue tipiche fluttuazioni di peso durante la vita adulta. Come mostrato, potrebbe essere l’aumento di peso o la perdita di peso. Ci sono tre punti principali di questo grafico che è molto importante tenere a mente.

Non dieta: questo grafico si basa sulle misure del peso corporeo quando NON si è a dieta o quando NON si sta provando a cambiare peso. Quindi questo è il tuo tipico piano di default in termini di peso. Questi cambiamenti di peso potrebbero essere dovuti al saltare il pasto, a un viaggio / vacanza e ad avere troppo cibo, cambiamenti di peso dovuti all’idratazione, errori di misurazione, malessere, lavoro troppo duro e così via.
Area ad alta probabilità: l’area ad alta probabilità in colore verde rappresenta la parte centrale della curva. Come puoi vedere per la maggior parte del tempo nella tua vita, la tua perdita di peso è di circa +3 a -3 chili. Ciò significa che c’è una probabilità molto alta che la maggior parte delle volte il tuo calo / guadagno sarà nell’arco di +3 a -3 chili. Le fluttuazioni di peso in quest’area potrebbero essere solo peso dovuto all’idratazione o errori di misurazione o al fatto di saltare un pasto o così via.
Area a bassa probabilità: l’area a bassa probabilità in colore rosso rappresenta la coda della curva. Come puoi vedere, solo poche volte nella tua vita la tua perdita di peso / guadagno arriverà fino a 5 chili. Ciò significa che c’è una probabilità molto bassa che il tuo calo / guadagno sia di 5 chili o più. Erano le volte in cui eri malato, perdevi peso o andavi in vacanza e guadagnavi molto peso o a causa di altre ragioni sconosciute.

Ora torniamo alla nostra perdita di 5 chili. Poiché la perdita di peso di 5 chili cade nella coda nella zona di probabilità bassa della curva, si sa che il rischio di ottenere risultati a causa del rischio (il peso dell’acqua, il pasto mancante, l’ammalarsi) è basso. Quindi siete convinti che i vostri risultati siano dovuti alla dieta e quindi siete giustamente eccitati. D’altra parte, se la perdita di peso era di 2-3 chili, sarà nel mezzo del grafico o nell’area ad alta probabilità. E poiché nella zona ad alta probabilità, sai che c’è un’alta probabilità che la perdita di peso di 2-3 chili sia dovuta a errori come peso dovuto all’idratazione, errore di misura, saltare un pasto e così via. In effetti, questo è esattamente il modo in cui funziona il concetto di Valore P. Il valore di probabilità qui è semplicemente il Valore P.

Per quanto riguarda gli studi?

Negli studi, il Valore P è probabilmente il risultato di errori di campionamento, giusto? Come possiamo ottenere un grafico degli errori di campionamento?

Grafico di distribuzione dello studio: Sì, in uno studio, invece di un grafico di distribuzione personale, abbiamo un grafico di distribuzione dello studio. A differenza delle variazioni di peso individuali nella distribuzione personale, ciascun cerchio rappresenta il peso medio di un campione casuale. Al posto degli errori dovuti al peso dell’acqua, saltare un pasto e così via, qui gli errori sono dovuti alla selezione di diversi campioni, cioè errori di campionamento. Ricordi la sezione di cui abbiamo parlato sullo studio del peso delle persone su Marte?

E indovina? Proprio come i tuoi grafici personali, vi è un’area ad alta probabilità e un’area a bassa probabilità nel grafico di distribuzione dello studio. La coda della curva o l’area di probabilità bassa rappresenta la probabilità del 5%. Quindi, ogni volta che i risultati sono nell’area della coda, sappiamo che la probabilità è inferiore al 5%.

Ora, proprio come il grafico di distribuzione personale, se i risultati dello studio ricadono sulla coda o sull’area a bassa probabilità della curva, sappiamo che il valore di probabilità o il valore p è inferiore al 5%. Cioè, la probabilità che i risultati siano dovuti al caso, in questo caso l’errore di campionamento, è molto bassa. Quindi, diciamo che la perdita di peso è dovuta alla dieta, al farmaco o all’intervento. Oppure diciamo che i risultati sono statisticamente significativi. E questo è tutto ciò che c’è da sapere sul Valore P.

Ora per alcune domande frequenti

Come otteniamo lo studio o la distribuzione del campione in uno studio?

Buona domanda. Il nome ufficiale di questo grafico è la “distribuzione campionaria” poiché rappresenta gli “errori di campionamento”. Come saprai, se non fosse per questo grafico, non c’è modo di trovare il Valore P.

Immagina lo studio sulla perdita di peso di cui abbiamo parlato, in cui il ricercatore prende 3 persone a caso su una popolazione di 10. In teoria, se ne prende 100 di campioni casuali di 3 soggetti, otterremo una curva che sembra esattamente come il grafico di distribuzione personale con aera alta e bassa probabilità. Ora tutto ciò di cui abbiamo bisogno è la distanza tra la regione centrale e l’area della coda, giusto?

Per ottenere la distanza, usiamo le sole due informazioni a nostra disposizione; la media del nostro campione e il numero di soggetti o dimensioni del campione. Collegandoli a un’equazione e utilizzando alcune ipotesi statistiche, otteniamo la distanza. Il problema è che quando la dimensione del campione aumenta, la distanza tra la regione centrale e l’area della coda si accorcia. Quindi, diventa più facile per il nostro risultato cadere sull’area di coda con campioni di dimensioni maggiori. Il Valore P dipende dalla grandezza del nostro risultato e dalla nostra dimensione del campione.

Ok. Perché hai scelto il 5% come taglio e non il 10%? E come sai che l’area della coda è del 5% di probabilità?

Il 5% è un limite arbitrario. Lo usiamo ancora a causa della forza della convenzione di qualsiasi altra cosa. In alcuni campi, come la fisica delle particelle, la soglia è 0,003. Se grafici quelli delle misure fisiche, come l’altezza, la pressione del sangue in migliaia di persone, il grafico sarà simile a una curva a campana. E alcune persone molto intelligenti hanno calcolato che il 95% dei valori cadrà nell’area centrale e il 5% cadrà sull’area della coda. È così che sappiamo che l’area della coda ci dà il 5% della probabilità.

La definizione attuale del Valore P dice “Il valore P è la probabilità di ottenere i risultati che hai registrato quando l’ipotesi nulla è vera.” Qual è l’ipotesi nulla e perché ne abbiamo bisogno?

Un’ipotesi nulla (significa zero) significa che stiamo ipotizzando che vi sia zero o nessuna differenza tra i nostri due gruppi (ad esempio farmaco per la perdita di peso e gruppo di controllo). In effetti, facciamo uno studio perché pensiamo che ci sia una differenza tra i due gruppi e vogliamo mostrare che c’è una differenza. Quindi affermare l’ipotesi nulla prima dello studio è un po’ strano.

Ora, perché abbiamo bisogno di questa strana assunzione nella definizione? Ricorda, il primo punto importante nell’esempio di perdita di peso personale: la mia distribuzione personale è la mia tipica fluttuazione del peso quando NON sto cercando di perdere peso o quando NON sono a dieta. Se il grafico includesse il peso perso a causa della dieta, non hai idea se i 5 chili siano dovuto all’idratazione, all’errore di misurazione o alla dieta, giusto? Quindi il Valore P dipende totalmente da questa ipotesi di ipotesi nulla.

Quindi il Valore P è la probabilità di ottenere i risultati a causa di “possibilità”?

A rigor di termini, no. Tutto ciò che abbiamo fatto è stato che abbiamo appena perso 5 chili e ci siamo sovrapposti al nostro grafico di distribuzione personale. Il risultato di 5 chili che abbiamo ottenuto potrebbe essere ancora del 100% a causa del caso. Una grande analogia è vincere il biglietto della lotteria: anche se vincere una lotteria è estremamente improbabile e si adatterebbe bene nella zona di coda o nella zona a bassa probabilità della nostra distribuzione, nessuno oserà dire che ha vinto la lotteria a causa di trucchi e non a causa del caso perché il Valore P è inferiore al 5%, giusto?

Quindi se il Valore P è inferiore al 5%, possiamo dire che i risultati sono credibili?

Tieni sempre presente che il Valore P è una misura dell’errore di campionamento o solo una misura dell’incertezza statistica. Di qui la ragione che quando è bassa, noi chiamiamo i risultati “statisticamente” significativi o “statisticamente” importanti.

Lo studio potrebbe avere un Valore P molto basso, ma potrebbe essere ancora imperfetto se la metodologia fa schifo, gli strumenti utilizzati non sono validi, non c’è randomizzazione, non ci sono tester accreditati e così via. Sfortunatamente, le persone amano ignorare questi problemi e concentrarsi ciecamente sul Valore P.

Conclusioni

Spero davvero che tu abbia una migliore comprensione del Valore P dopo aver letto l’articolo. Ho omesso i dettagli, come l’errore standard / deviazione, l’ipotesi alternativa, la curva normale e così via e focalizzata sul quadro generale. Penso che senza l’esempio della perdita di peso personale sia abbastanza difficile capire il concetto.

La prossima volta, quando qualcuno parla di un Valore P,

Prova a immaginare la distribuzione personale o dello studio quando il farmaco o l’intervento NON ha effetto
Sovrapponi i risultati dello studio su questo grafico.
Se i risultati cadono nell’area della coda o nell’area a bassa probabilità, il Valore P è inferiore al 5% e lo studio è “statisticamente significativo”.