La noticia del hallazgo del Boson de Higgs fue dada en términos de 5-sigma, y he leído en varios post que hay mucha confusión sobre que esto significa (se habla de que 5-sigma significa 95% de confianza, 99,5% y cosas así), es por ello que en el presente post espero explicar un poco de que se trata el experimento y que significa dicha forma de presentar el resultado.
Para entender la terminología primero se debe entender el experimento realizado, no soy físico así que si alguien encuentra un error en lo que voy a describir, que me lo haga saber y lo corregiré al instante. Lo primero que debo resaltar es que el Boson de Higgs no se ha detectado directamente en el CERN, el experimento consiste en confirmar su existencia de manera indirecta, según la teoría una de las formas en que se produce el bosón de Higgs es a través de la fusión de los Gluones, estos producen un Boson de Higgs e inmediatamente este se desintegra en Quarks y lo que se mide es la energía producida en este proceso, con estos datos se puede armar un gráfico de Número de Fusiones o Colisiones versus Energía producida; en paralelo se tiene la curva para las colisiones que se sabe que no involucran al Boson de Higgs.
Ok, entonces entendido (mas o menos) el experimento vamos a la parte estadística que se resume en determinar si el número de collisiones al nivel de energía «x»es diferente a lo que debería ser si no hubiese producción de Bosones de Higgs, y aquí entra el famoso 5-sigma.
Suponiendo que no hay producción de Bosones de Higgs en todas las fusiones realizadas, se debe cumplir que al nivel «x» de energía el número de colisiones detectadas siguen una distribución normal, así este enfoque le permite a uno calcular la probabilidad de un falso positivo. Lo que nos dicen es:
“Observamos en nuestros datos señales claras de una nueva partícula, al nivel de 5 sigma, en la región de masas de alrededor de 126 gigaelectronvoltios [unas 134 veces la masa de un protón]”
> 1 - pnorm(5) [1] 2.866516e-07
esto es p = 0.0000003.
Finalmente, les dejo un gráfico para entender un poco el 5-sigma en una Normal Estándar (el código R para generarlo se muestra debajo del mismo)
library(ggplot2) x <- seq(-6,6,length=1000) # valores de "x" y <- dnorm(x) # distribucion Normal df <- data.frame("x" = x,"y" = y) # plot text_block <- "Al nivel 5-sigma significa que \nencontraron algo diferente que \ncaía a 5-sigma de distancia \nde la media" ggplot(df, aes(x,y)) + geom_line(size=1) + annotate("text", x=1.7, y=0.15, label=text_block, size=4, hjust=0) + annotate("segment", x = 5, xend=5, y = 0, yend = 0.05, linetype="dashed") + annotate("text", x=5, y=0.05, label="5-sigma", vjust=-0.5)