Perché i fisici menzionano “cinque sigma” nei loro risultati?

Questo articolo è la traduzione dall’inglese dell’articolo del CERN https://home.cern/resources/faqs/five-sigma

Quando viene fatta una nuova scoperta sulla fisica delle particelle, potresti aver sentito usare il termine “sigma”. Cosa significa? Perché è così importante parlare di sigma quando si avanza una richiesta per la scoperta di una nuova particella? E perché “Five Sigma” in particolare è così importante?

Perché la fisica delle particelle si basa sulla statistica?

Le particelle prodotte nelle collisioni nel Large Hadron Collider (LHC) sono minuscole e hanno una vita estremamente breve. Poiché decadono quasi immediatamente in altre particelle, è impossibile per i fisici “vederle” direttamente. Invece, esaminano le proprietà delle particelle finali, come la loro carica, massa, spin e momento. SI comportano come investigatori: i prodotti finali forniscono indizi sulle possibili trasformazioni che le particelle hanno subito durante il loro decadimento. Le probabilità di questi cosiddetti “canali di decadimento” sono previste dalla teoria.

Nell’LHC, milioni di collisioni di particelle al secondo vengono tracciate dai rilevatori e filtrate attraverso sistemi di trigger per identificare i decadimenti di particelle rare. Gli scienziati quindi analizzano i dati filtrati per cercare anomalie, che possono indicare nuova fisica.

Come in ogni esperimento, c’è sempre la possibilità di errore. Il rumore di fondo può causare fluttuazioni naturali nei dati con conseguenti errori statistici. Esiste anche il rischio di errori se non ci sono dati sufficienti o di errori sistematici causati da apparecchiature difettose o piccoli errori nei calcoli. Gli scienziati cercano modi per ridurre l’impatto di questi errori per garantire che le affermazioni che fanno siano il più accurate possibile.

Qual è la significatività statistica?

Immagina di lanciare un dado standard. C’è una probabilità su sei di ottenere un numero. Ora immagina di lanciare due dadi: la probabilità di ottenere un certo numero totale varia: c’è solo un modo per ottenere un due e sei modi diversi per ottenere un sette. Se lanciassi due dadi molte, molte volte e registrassi i risultati, la forma del grafico seguirebbe una curva a campana nota come distribuzione normale.

La distribuzione normale ha alcune proprietà interessanti. È simmetrica, il suo picco è chiamato media e la dispersione dei dati viene misurata utilizzando la deviazione standard. Per i dati che seguono una distribuzione normale, la probabilità che un punto dati si trovi all’interno di una distanza dal valore medio pari a una deviazione standard è del 68%, entro due deviaizioni standard è del 95%, entro tre è ancora più alta.

La deviazione standard è rappresentata dalla lettera greca σ, o sigma. Misurata in base al numero di deviazioni standard dalla media, la significatività statistica è la distanza di un determinato punto dati dal suo valore atteso.

Un grafico che mostra la curva a campana di una distribuzione normale con zone che mostrano le deviazioni standard
Per i dati che seguono una distribuzione normale, la probabilità che un punto dati si trovi all’interno di una deviazione standard o di un sigma (σ) del valore medio è del 68%, entro due σ è del 95%, entro tre σ è ancora più alta (Immagine: MW Toews )

Cosa c’entra questo con la fisica?

LHC 5 sigma significance
LHC 5 sigma significance

Quando gli scienziati registrano i dati dell’LHC, è naturale che si verifichino piccole irregolarità e fluttuazioni statistiche, ma queste sono generalmente vicine al valore atteso. C’è un’indicazione di un nuovo risultato quando c’è un’anomalia più grande. A che punto questa anomalia può essere classificata come un fenomeno nuovo? Gli scienziati usano la statistica per scoprirlo.

Immagina di nuovo la metafora dei dadi. Solo che questa volta stai lanciando un dado, ma non sai se è truccato. Lo lanci una volta e ottieni un tre. Non c’è nulla di particolarmente significativo in questo – c’era una possibilità su sei del tuo risultato – hai bisogno di più dati per determinare se è ponderato. Lo lanci due, tre o anche di più e ogni volta esce un tre. A che punto puoi confermare che è truccato?

Non esiste una regola particolare per questo, ma dopo circa otto volte in cui hai ottenuto lo stesso numero, sarai abbastanza certo che lo sia. La probabilità che ciò accada per caso è solo (1/6) 8 = 0,00006%.

Allo stesso modo, è così che i fisici determinano se un’anomalia è effettivamente un risultato. Con un numero sempre maggiore di dati, la probabilità di una fluttuazione statistica in un punto specifico diventa sempre più piccola. Nel caso del bosone di Higgs , i fisici avevano bisogno di dati sufficienti affinché la significatività statistica superasse la soglia di cinque sigma. Solo allora avrebbero potuto annunciare la scoperta di “una particella simile a Higgs”.

Cosa significa quando i fisici affermano che i dati hanno un significato statistico di cinque sigma?

Un risultato che ha una significatività statistica di cinque sigma indica la probabilità quasi certa che un aumento nei dati sia causato da un nuovo fenomeno, piuttosto che da una fluttuazione statistica. Gli scienziati lo calcolano misurando il segnale rispetto alle fluttuazioni previste nel rumore di fondo su tutta la gamma. Per alcuni risultati, le cui anomalie potrebbero trovarsi in entrambe le direzioni al di sopra o al di sotto del valore atteso, una significatività di cinque sigma è la probabilità dello 0,00006% che i dati siano fluttuanti. Per altri risultati, come la scoperta del bosone di Higgs, una significatività di cinque sigma è la probabilità dello 0,00003% di una fluttuazione statistica, poiché gli scienziati cercano dati che superano il valore di cinque sigma su metà del grafico della distribuzione normale.

Perché il cinque sigma è particolarmente importante per la fisica delle particelle?

Nella maggior parte delle aree scientifiche che utilizzano l’analisi statistica, la soglia di cinque sigma sembra eccessiva. In uno studio sulla popolazione, come i sondaggi su come voteranno le persone, di solito sarebbe sufficiente un risultato con una significatività statistica di tre sigma. Tuttavia, quando si parla della struttura stessa dell’Universo, gli scienziati mirano ad essere il più precisi possibile. I risultati della natura fondamentale della materia sono di grande impatto e hanno ripercussioni significative se sono sbagliati.

In passato, i fisici hanno notato risultati che potevano indicare nuove scoperte, con i dati che avevano solo una significatività statistica da tre a quattro sigma. Questi sono stati spesso smentiti man mano che venivano raccolti più dati.

Se si verifica un errore sistematico, ad esempio un errore di calcolo, l’elevato significato iniziale di cinque sigma può significare che i risultati non sono completamente nulli. Tuttavia, ciò significa che il risultato non sia definitivo e non possa essere utilizzato per rivendicare una nuova scoperta.

Five Sigma è considerato il “gold standard” nella fisica delle particelle perché garantisce una probabilità estremamente bassa che un’affermazione sia falsa.

Ma non tutti e cinque i sigma sono uguali…

Cinque sigma è generalmente il valore accettato per la significatività statistica per la ricerca di nuove particelle all’interno del Modello Standard – quelle particelle che sono previste dalla teoria e si trovano nella nostra attuale comprensione della natura. La significatività cinque sigma è accettata anche quando si ricercano proprietà specifiche del comportamento delle particelle, poiché ci sono meno possibilità di trovare fluttuazioni altrove nell’intervallo.

Se cinque sigma siano una significatività statistica sufficiente può essere determinato confrontando la probabilità della nuova ipotesi con la possibilità che si tratti di una fluttuazione statistica, tenendo conto della teoria.

Per la fisica oltre il Modello Standard, o per i dati che contraddicono la fisica generalmente accettata, è richiesto un valore di significatività statistica molto più elevato – abbastanza efficace da “confutare” la fisica precedente. Nel suo articolo “ Il significato di cinque sigma ”, il fisico Louis Lyons suggerisce che i risultati per fenomeni più improbabili dovrebbero avere un significato statistico più elevato, come il sette sigma per il rilevamento delle onde gravitazionali o la scoperta dei pentaquark.

In questo articolo, Lyons ritiene anche che la significatività statistica di cinque sigma sia sufficiente per la scoperta del bosone di Higgs. Questo perché la teoria del bosone di Higgs era stata prevista, testata matematicamente e generalmente accettata dalla comunità dei fisici delle particelle ben prima che LHC potesse generare le condizioni per poterlo osservare. Ma una volta raggiunto questo obiettivo, era ancora necessaria un’elevata significatività statistica per determinare se il segnale rilevato fosse effettivamente una scoperta.

_____________________________________________________________________________

Una significatività statistica di cinque sigma è rigorosa, ma in realtà è minima. Un valore più elevato per la significatività statistica conferma che i dati sono più affidabili. Tuttavia, ottenere risultati con significatività statistica di sei, sette o addirittura otto sigma richiede molti più dati, molto più tempo e molta più energia. In altre parole, una probabilità pari al massimo allo 0,00006% che un nuovo fenomeno non sia un colpo di fortuna statistico è abbastanza buona.

Scopri di più:

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.

Questo sito utilizza Akismet per ridurre lo spam. Scopri come vengono elaborati i dati derivati dai commenti.