
¿Qué es la estadística inferencial?
La estadística inferencial utiliza los datos y la probabilidad para ayudarnos a responder a preguntas como ¿Este medicamente es efectivo contra esta enfermedad?, ¿El botón rojo convierte más que el botón azul?
¡No te pierdas ningún nuevo vídeo!
Visita mi canal de Youtube
Sin embargo, es importante destacar que la estadística inferencial no responde a estas preguntas de manera inequívoca, sino que nos ayuda a definir qué es más o menos probable. La intuición detrás de esto la vivimos en muchos eventos cotidianos. Por ejemplo, cuando un alumno siempre saca malas notas y de repente tiene un sobresaliente estaríamos sospechando. En este caso no podemos afirmar con certeza que este estudiante ha copiado, pero es muy improbable que esta nota se deba al azar. Si testamos un nuevo medicamente y vemos que 54 de 100 pacientes mejoran comparado con los 49 del grupo de control (con placebo), no podríamos concluir que el medicamento funciona. Pero si 96 pacientes mejoraran, seguiría siendo posible que la mejora no se deba al medicamento, pero es bastante improbable. En lenguaje “estadístico” diríamos que “si el medicamento no tuviera efecto, esta diferencia entre el grupo con el medicamento y el grupo con el placebo sería muy improbable; por ello es muy improbable que el medicamento no tenga un efecto positivo”.
La frase “es muy improbable que” es la clave de la estadística inferencial dado que para ser preciso lo que hacemos es rechazar una hipótesis (que el medicamento no tiene efecto) más que confirmar que el medicamento tiene efecto. Aquí estamos hablando de la “Hipótesis nula”, que es la de donde partimos (no tiene efecto) y de la “Hipótesis alternativa”, es decir que el medicamento tiene efecto. Es muy importante elegir bien la hipótesis nula, que tiene que ser la hipótesis por defecto, o lo que asumirías si no hicieras la prueba. En nuestro ejemplo, sin la prueba, tendrías que asumir que el medicamento no tiene efecto, y todo el esfuerzo tiene que ser para probar lo contrario. Es como cundo se imputa a alguien por un presunto crimen. La presunción de inocencia es nuestra hipótesis nula, o la opción por defecto, y la carga de la prueba la tiene la acusación para probar que es culpable más allá de cualquier duda razonable.
Para demostrarte la importancia de elegir bien la hipótesis nula vamos a hacer un ejercicio teórico. Supongamos por un momento que nuestra hipótesis nula es que el medicamente tiene efecto positivo. Nuestra prueba entonces debería demostrar lo contrario. Damos el medicamento al grupo de test y vemos que 46 no mejoran comparado con 51 del grupo de control. No podemos rechazar la hipótesis nula que el medicamento tiene efecto positivo. Por absurdo que pueda parecer, esta sería la conclusión estadísticamente correcta, es decir que el medicamento tiene efecto positivo. Por ello es crítico definir correctamente las dos hipótesis.
Ahora que este concepto está claro, probablemente te surja otra duda: ¿Cuándo consideramos que una variación es tan poco probable como para rechazar la hipótesis nula? Comúnmente se utiliza un “nivel de significación” del 5%, o 0,05. Traducido en un lenguaje más familiar, rechazamos la hipótesis nula cuando hay menos de un 5% de probabilidad de ver una resultado o diferencia tan extrema si la hipótesis nula fuera verdadera. Esto está relacionado con los conceptos del teorema del límite central y de distribución normal, que te aconsejo leer antes de seguir con este post. En el caso de comparar la media de dos muestras, podemos calcular el error típico. Este nos dará una medida de dispersión que podemos esperar, en media, cuando restamos la media de una muestra a la media de la otra. Este error lo usamos para calcular la probabilidad de que dos muestras procedan de la misma población, es decir que en aproximadamente el 95% de los casos la diferencia entre las muestras será menor que dos errores típicos (suponemos que la diferencia real sería cero si proceden de la misma población).
Dicho esto, tenemos que volver un momento al “nivel de significación” o el error de tipo “I” que estamos dispuestos a asumir. Esto significa que siempre puede haber un error de rechazar la hipótesis nula cuando esta es verdadera. Para disminuir esta probabilidad, podemos disminuir alfa (error), por ejemplo a un 1%. Sin embargo, si por una parte disminuimos el error de un falso positivo, por otra parte aumentamos la probabilidad de un falso negativo (error de tipo II, o Beta). Este último error es cuando no rechazamos la hipótesis nula cuando la deberíamos rechazar. Entonces ¿Cómo elegimos que nivel de error utilizar? Pues no hay una respuesta correcta, pero lo habitual es utilizar por defecto 5%, y lo aumentaremos o disminuiremos dependiendo del coste de cada error. Veamos dos ejemplos:
- Filtro para detectar emails no deseados: en este caso el coste de que un email “normal” sea filtrado como “no deseado” es importante, y podemos tolerar que de vez en cuando algún correo no deseado llegue a nuestro buzón de entrada. En este caso lo ideal es disminuir el nivel de significación para disminuir el error I (falso positivo).
- Detectar un cáncer: en este caso un falso negativo puede repercutir muy negativamente (es decir un cáncer no detectado), así que es mejor aumentar el nivel de significación para disminuir el error II (falso negativo).
Por último, a la hora de elegir el nivel de significación, hay que recordar que cuanto más grande sea la muestra, tanto más tenderán a ser significativas las pequeñas diferencias. Veamos un ejemplo. En 2011 escandalizó un artículo publicado en la revista científica “Journal of Personality and Social Psychology” donde se afirmaba que las personas tienen poderes extrasensoriales. La prueba consistía en preguntar a un gran número de participantes de adivinar, en una pantalla de ordenador, detrás de qué cortina se escondía la foto erótica (en cada prueba había dos cortinas). El resultado fue que el 53% de las personas adivinaron, y, debido al tamaño de la muestra, la variación con respecto al 50% hipotético era significativa (con un nivel de significación del 5%). En estos casos, podemos, antes del experimento, ser más estrictos con el nivel de significación (si el coste de los errores lo permite), o podemos repetir el experimento dos o más veces.
Ahora que ya conoces los principios de la estadística inferencial, puedes utilizarlos para realizar pruebas de hipótesis. En este artículo tienes una tabla completa con las pruebas de hipótesis y repaso los conceptos de error I y II.