fbpx

Uno de los conceptos con más relevancia en los análisis estadísticos es el p-value. El p-value es un valor que indica la probabilidad de que los resultados de los experimentos se hayan observado por “casualidad”.

Lo que se debe tener en cuenta es cuando se manipulan los p-values hacia tu propio fin. A menudo, cuando el p-value es <0.05, se considera que el resultado es significativo.

Sin embargo, si haces 20 pruebas, esperarías que una de las veinte pruebas (5%) sea significativa. En la era del big-data, evaluar veinte hipótesis es muy fácil. Y es aquí donde surge el término p-hacking.

p-hacking es cuando buscas exhaustivamente un conjunto de datos para encontrar patrones y correlaciones que parecen estadísticamente significativas en virtud de la gran cantidad de pruebas que has realizado. Estas correlaciones pueden reportarse como significativas y, si se hacen suficientes pruebas, se puede encontrar un conjunto de datos y análisis que mostrarán lo que se quería ver.

Siguiendo este contexto es que se puede encontrar una correlación entre entre los colores de los “jelly beans” y el acné. Suena ilógico, sin embargo es una manera sencilla de esquimatizar el p-hacking.

Finalmente, en esta página puedes “hackear tu camino hacia la gloria científica” y conocer más acerca de este tema.