Análisis de la varianza (ANOVA) en Excel

Nov 22, 2020 | ANÁLISIS, Estadística | 0 Comentarios

Mientras que con una prueba t solo podemos analizar dos grupos, con un análisis de la varianza (ANOVA), podemos examinar varios grupos y decidir si las medias de estas muestras son significativamente diferentes. El análisis más sencillo es el análisis de la varianza unidireccional, en el que la varianza depende de un único factor. Imaginemos que queremos saber si la edad de las personas que compran tres productos distintos es significativamente diferente para así poder centrar mejor las campañas promocionales. En este caso, tendremos únicamente un factor (tipo de producto); y por lo tanto, llevaremos a cabo un análisis de la varianza unidireccional tras comprobar el supuesto de normalidad (que expliqué en Regresiones en Excel: requisitos).

¡No te pierdas ningún nuevo vídeo!

Visita mi canal de Youtube

Cuando haya finalizado la prueba, tendremos que comprobar el valor p (< 0,05) y el valor F (mayor que el valor crítico F) para rechazar la hipótesis nula y deducir que las poblaciones no son iguales. En el ejemplo propuesto, existe una diferencia de edad significativa entre los compradores de estos productos. Sin embargo, deberíamos realizar una prueba t para cada par de grupos para determinar dónde está la diferencia.

En un análisis de la varianza bidireccional tendremos que analizar dos factores. Por ejemplo, estamos vendiendo los productos A, B, y C en tres países (1, 2, y 3). En el ejemplo propuesto, utilizaremos un análisis de la varianza bidireccional con una sólo muestra por grupo (“Análisis de varianza de dos factores con una sola muestra por grupo”) dado que tan solo se registrará una observación para cada combinación de factores (utilizaremos un análisis de la varianza “con réplica” en caso de que tengamos que registrar más observaciones para cada combinación). En un análisis de la varianza bidireccional, tendremos que analizar dos hipótesis nulas, una para cada factor, y es posible que se rechace la hipótesis para un factor pero no para el otro.

En nuestro ejemplo, rechazaremos la hipótesis nula para el factor de “tipo de producto” (filas), dado que su valor p es inferior a 0,05, pero no podemos rechazar la hipótesis nula del factor “país” (columnas).

 También podemos llevar a cabo un análisis de la varianza con medidas repetidas siempre y cuando tengamos medidas repetidas dentro del mismo grupo. En nuestro ejemplo, una empresa decide poner en marcha un programa de formación de cuatro semanas para cinco empleados con el objetivo de reducir el número de errores cometidos en el trabajo. En este caso, las medidas repetidas son los errores de cada empleado durante la misma semana de formación.

menu importar desde web Power Query

La plantilla contiene los cálculos para un análisis de la varianza de factor único con medidas repetidas. En nuestro ejemplo, dado que el valor p es inferior a 0,05 (nuestro alfa elegido), rechazamos la hipótesis nula de que no hay diferencia entre las medias de la semana y deducimos que la formación ha tenido un impacto en el número de errores (imagen anterior).

Podemos utilizar el complemento de análisis de datos de Excel para llevar a cabo un análisis de la varianza de dos factores con medidas repetidas, eligiendo la prueba “Análisis de varianza de dos factores con varias muestras por grupo” En el ejemplo propuesto, estamos vendiendo diferentes versiones del producto en mercados distintos y queremos analizar si alguno de los productos o el mercado (o ambos) tienen un impacto en el número de productos vendidos. Los resultados muestran que, mientras que el tipo de producto (filas) sí afecta a las ventas (valor p < 0,05), el mercado (columnas) no (imagen siguiente).

Una extensión del análisis de la varianza (ANOVA) es el análisis multivariante de la varianza (MANOVA), que nos permitirá llevar a cabo el análisis con más de una variable dependiente. Por ejemplo, es posible realizar un análisis multivariante de la varianza (MANOVA) utilizando el «nivel educativo» como variable independiente categórica y «resultado de la prueba» e «ingresos anuales» como las variables independientes continuas.

80 Modelos fundamentales para analistas de negocio

Este post se basa en el libro “80 Fundamental Models for Business Analysts“ donde se explican diferentes modelos de análisis acompañados de plantillas Excel.

 Tienes a tu disposición una plantilla con los cuatro tipos de ANOVA analizados en este post. ¡Suscríbete para descargarla!