Prueba t en excel

Jul 24, 2020 | ANÁLISIS, Estadística | 0 Comentarios

Existen tres aplicaciones principales de una prueba t:

  • Prueba t con una muestra: nos permite comparar la media de una muestra con la media de su población;
  • Prueba t con dos muestras: para comparar dos medias de dos muestras;
  • Prueba t emparejada: nos permite comparar las medias de la misma muestra en dos distintas situaciones (por ejemplo, antes y después de un tratamiento).

¡No te pierdas ningún nuevo vídeo!

Visita mi canal de Youtube

Para llevar a cabo una prueba t, resulta necesario comprobar el supuesto de normalidad; no obstante, la prueba t tolera desviaciones de la normalidad siempre y cuando el tamaño de la muestra sea grande y las dos muestras tengan un número parecido de elementos. En caso de desviaciones de la normalidad significativas, podemos o bien transformar los datos o bien utilizar una prueba no-paramétrica.

Una alternativa a la prueba t es la prueba z; sin embargo, además del supuesto de normalidad, necesita un tamaño de muestra mayor (por lo general > 30) así como la desviación estándar de la población.

Cada uno de los tres tipos de pruebas t descritos anteriormente tiene dos variantes en función del tipo de hipótesis que se va a analizar. En caso de que la hipótesis alternativa sea que las dos medias son diferentes, entonces será necesario realizar una prueba de dos colas (también denominada bilateral). Si la hipótesis consiste en que una media es mayor o menor que la otra, entonces habrá que llevar a cabo una prueba de una cola (o unilateral). También resulta posible especificar en la hipótesis que la diferencia será mayor que un determinado número (en pruebas t emparejadas y de dos muestras).

Tras realizar la prueba, podremos rechazar la hipótesis nula (no hay diferencias) en caso de que el valor p sea menor que el alfa (α) elegido  (normalmente 0,05) y siempre que el valor estadístico t no se encuentre entre el valor crítico t positivo y el negativo (ver plantilla). El valor crítico de t para una prueba bilateral (dos colas críticas t) se utiliza para calcular el intervalo de confianza que se situará en el 1 menos el α elegido (si elegimos 0,05, tendremos un intervalo de confianza del 95%).

PRUEBA T DE UNA MUESTRA

Con esta prueba, comparamos la media de una muestra con la media de la población. Por ejemplo, tenemos una fábrica de champú y sabemos que cada envase tiene que llenarse con 300 ml de champú. Para controlar la calidad del producto final, tomaremos muestras aleatorias de la línea de producción y mediremos el volumen de champú. Dado que queremos poder parar y arreglar la línea de producción en caso de que la cantidad de champú sea menor o mayor que la cantidad esperada (300 ml), tendremos que llevar a cabo una prueba de dos colas. La imagen siguiente incluye los datos de entrada así como la desviación estándar calculada y la media de la muestra que es de 295. Se elige un nivel de confianza de 0,05. 

Prueba t una muestra Excel

A continuación, calculamos el valor crítico t así como el valor p (las fórmulas pueden consultarse en la plantilla). Puesto que el valor p es menor que el alfa (0,05), llegamos a la conclusión de que la diferencia en las medias es significativa y que deberíamos arreglar nuestra línea de producción. Los resultados también incluyen un intervalo de confianza del 95%, lo cual significa que tenemos un nivel de confianza del 95% en que los envases se llenan con un volumen mínimo de 292 ml y uno máximo de 298 ml. Tienes a tu disposición una plantilla Excel donde sólo necesitas reemplazar los datos de la muestra (columna “verde”) y revisar  la celda “significación” del tipo que elegiste (dos colas, cola izquierda, cola derecha). Para descargar la plantilla date de alta al final de este post.

Prueba t una muestra Excel resultados

PRUEBA T DE DOS MUESTRAS

Un ejemplo práctico sería tener que determinar si los clientes masculinos compran más o menos que los clientes femeninos.

En primer lugar, deberíamos definir nuestra hipótesis. En nuestro ejemplo, nuestra hipótesis consiste en que los clientes masculinos y los femeninos no compran la misma cantidad de productos, así que deberíamos usar una prueba de dos colas; es decir, no deducimos que un grupo específico compre más que el otro. Por otro lado, nos gustaría analizar si los hombres compran más, por lo que, en este caso, usaríamos una prueba de una cola.

En el complemento de Excel Análisis de datos elegiremos la opción “Prueba t para dos muestras suponiendo varianzas desiguales” por defecto, ya que aunque las varianzas fueran iguales, los resultados no serían distintos, pero si suponemos que las varianzas son iguales, entonces acabaremos teniendo un problema en los resultados si las varianzas resultan no ser finalmente iguales. Seleccionamos los datos para las dos muestras y especificamos nuestro nivel de confianza (alfa, por defecto, de 0,05).

Prueba t dos muestras Excel

Ya que estamos analizando la diferencia, o bien positiva o negativa, en el resultado, tendremos que utilizar el valor p de dos colas y el valor crítico t de dos colas. En este ejemplo, la diferencia es significativa puesto que el valor p es menor que el alfa elegido (0,05). Los intervalos de confianza también se calculan en la plantilla y se llega a la conclusión de que tenemos un nivel de confianza del 95% en que las mujeres compran entre 8 y 37 productos más que los hombres.

PRUEBA T EMPAREJADA

Queremos analizar dos productos diferentes entre varios posibles consumidores para decidir cuál es mejor, pidiendo a los participantes que prueben cada uno y lo clasifiquen en una escala del 1 al 10. Dado que hemos decidido utilizar al mismo grupo para probar ambos productos, vamos a llevar a cabo una prueba t emparejada de dos colas. El alfa elegido es 0,05. Para la prueba te emparejada usamos el complemento de Excel Análisis de datos elegiremos la opción “Prueba t para medias de dos muestras emparejadas” .

Los resultados del ejemplo muestran que no hay ninguna diferencia significativa en la clasificación de los dos productos ya que el valor p (de dos colas) es mayor que el alfa (0,05). La plantilla también contiene el intervalo de confianza de la diferencia media, que en este caso incluye el 0 ya que no hay ninguna diferencia significativa. Para más información y las instrucciones detalladas, puedes descargar la plantilla Excel (suscríbete al final de este post).

Prueba t emparejada Excel
The Art of Data Analysis

 

Este post se basa en mi último libro “The Art of Data Analysis: Non-Technical Sills for Data Analysts” clasificado cómo mejor nueva publicación en las categorías Business y Matemathics en Amazon.com en agosto 2020 (#1 New Release in Business Mathematics)