La estadística en el hallazgo del Boson de Higgs y el significado del 5-sigma

La noticia del hallazgo del Boson de Higgs fue dada en términos de 5-sigma, y he leído en varios post que hay mucha confusión sobre que esto significa (se habla de que 5-sigma significa 95% de confianza, 99,5% y cosas así), es por ello que en el presente post espero explicar un poco de que se trata el experimento y que significa dicha forma de presentar el resultado.

Para entender la terminología primero se debe entender el experimento realizado, no soy físico así que si alguien encuentra un error en lo que voy a describir, que me lo haga saber y lo corregiré al instante. Lo primero que debo resaltar es que el Boson de Higgs no se ha detectado directamente en el CERN, el experimento consiste en confirmar su existencia de manera indirecta, según la teoría una de las formas en que se produce el bosón de Higgs es a través de la fusión de los Gluones, estos producen un Boson de Higgs e inmediatamente este se desintegra en Quarks y lo que se mide es la energía producida en este proceso, con estos datos se puede armar un gráfico de Número de Fusiones o Colisiones versus Energía producida; en paralelo se tiene la curva para las colisiones que se sabe que no involucran al Boson de Higgs.

Proceso de detección del Boson de Higgs (explicado por PHDcomics)

Proceso de detección del Boson de Higgs (explicado por PHDcomics)

Ok, entonces entendido (mas o menos) el experimento vamos a la parte estadística que se resume en determinar si el número de collisiones al nivel de energía «x»es diferente a lo que debería ser si no hubiese producción de Bosones de Higgs, y aquí entra el famoso 5-sigma.

Suponiendo que no hay producción de Bosones de Higgs en todas las fusiones realizadas, se debe cumplir que al nivel «x» de energía el número de colisiones detectadas siguen una distribución normal, así este enfoque le permite a uno calcular la probabilidad de un falso positivo. Lo que nos dicen es:

“Observamos en nuestros datos señales claras de una nueva partícula, al nivel de 5 sigma, en la región de masas de alrededor de 126 gigaelectronvoltios [unas 134 veces la masa de un protón]”

Entonces, ¿qué quieren decir los físicos presentando resultados «al nivel 5-sigma»? Bueno, digamos que es sólo otra convención de informar los valores alfa, sabemos que sigma se refiere a la desviación estándar de la población, y 5-sigma significa que aceptan eventos como estadísticamente significativos si estos caen a una distancia mayor a 5 veces sigma con respecto a la media, es decir que el 5-sigma no se refiere al nivel de confianza de que lo descubierto sea un Boson de Higgs, sino que es el nivel de confianza de que han encontrado algo diferente de lo que se esperaba en el experimento si no hubiese producción de Boson de Higgs.
Se puede obtener el valores de p para el 5-sigma en R haciendo:
> 1 - pnorm(5)
[1] 2.866516e-07

esto es p = 0.0000003.

 

Finalmente, les dejo un gráfico para entender un poco el 5-sigma en una Normal Estándar (el código R para generarlo se muestra debajo del mismo)

 

5-sigma en una Normal Estándar

5-sigma en una Normal Estándar

library(ggplot2)
x <- seq(-6,6,length=1000)  # valores de "x"
y <- dnorm(x)               # distribucion Normal
df <- data.frame("x" = x,"y" = y) 

# plot
text_block <- "Al nivel 5-sigma significa que \nencontraron algo diferente que \ncaía a 5-sigma de distancia \nde la media"
ggplot(df, aes(x,y)) +
  geom_line(size=1) +
  annotate("text", x=1.7, y=0.15, label=text_block, size=4, hjust=0) +
  annotate("segment", x = 5, xend=5, y = 0, yend = 0.05, linetype="dashed") +
  annotate("text", x=5, y=0.05, label="5-sigma", vjust=-0.5)

Deja un comentario

Tu email nunca se publicará.


Ir a la barra de herramientas