Prueba de Chi-cuadrado en Excel

Nov 22, 2020 | ANÁLISIS, Estadística | 0 Comentarios

Una prueba de chi-cuadrado se utiliza para analizar las frecuencias de observaciones independientes con dos objetivos principales:

  • La prueba de independencia: para determinar la asociación entre dos variables categóricas, por ejemplo, si el tipo de estado civil no afecta al tipo de servicio que compran los clientes;
  • La prueba de la bondad de ajuste: para determinar la diferencia entre los valores observados y los valores esperados (por ejemplo, si una muestra tomada de una población sigue la distribución de la población esperada o una distribución teórica).

¡No te pierdas ningún nuevo vídeo!

Visita mi canal de Youtube

En cualquiera de los casos, el método utilizado es el mismo; concretamente, aplicaremos una prueba de chi-cuadrado utilizando los valores observados y los valores esperados. Siempre que utilicemos una prueba de chi-cuadrado, resulta importante tener presente que esta prueba es sensible al tamaño de la muestra (con menos de 50, esta prueba no será adecuada) y necesita tener una frecuencia mínima en cada contenedor o clase (como mínimo 5). Si estas condiciones no se cumplen, deberíamos entonces considerar usar una prueba exacta de Fisher.

Prueba de independencia. En el ejemplo, estamos analizando la independencia de las variables «estado civil» y “nivel de servicio” elegidas por los clientes.

Para esta prueba, asumimos que la probabilidad de recibir un nivel de servicio específico y la probabilidad de estar casado/a, soltero/a o divorciado/a son acontecimientos independientes. Con estas suposiciones, comparamos la distribución real de los productos vendidos en cada país y la distribución esperada basada en las probabilidades independientes de los dos acontecimientos (ver plantilla). En otras palabras, la prueba compara las frecuencias esperadas con las frecuencias reales. A continuación, se aplica la fórmula de Excel “=PRUEBA.CHICUAD”, y si el valor p resultante es inferior a 0,05 (u otro alfa elegido), rechazaremos la hipótesis nula (es decir, las dos variables son independientes) y podremos, por lo tanto, deducir que las dos variables están relacionadas. En otras palabras, podemos afirmar que el estado civil afecta al nivel de servicio recibido.

Bondad de ajuste. La bondad de ajuste puede calcularse en Excel utilizando la misma fórmula (=CHITEST) que tendrá que aplicarse a una columna (o fila) con valores observados y una columna con valores esperados. Por ejemplo, si tiramos un dado, esperamos que cada número tenga la misma probabilidad de salir (1/6) pero podemos sospechar que el dado esté trucado. En nuestro ejemplo, tiramos el dado 60 veces y esperamos obtener cada número 10 veces. Si el valor p es inferior a 0,05, rechazaremos la hipótesis nula, que consiste en que las variables son independientes (es decir que los valores observados son significativamente diferentes a los valores esperados). 

 Ya que el valor p es superior a 0,05, llegaremos a la conclusión de que el dado no está trucado. También podemos comparar nuestros valores observados con una distribución teórica.

menu importar desde web Power Query

La prueba de chi-cuadrado también puede utilizarse en lugar de usar la prueba z en una prueba de proporciones cuando no se cumplen los supuestos necesarios para utilizar una prueba paramétrica. En este caso, compararemos la proporción observada con la proporción esperada a través de una tabla de contingencia de doble entrada (la misma tabla utilizada en la prueba de independencia pero con tan solo dos categorías por fila y dos categorías por columna).

80 Modelos fundamentales para analistas de negocio

Este post se basa en el libro “80 Fundamental Models for Business Analysts“ donde se explican diferentes modelos de análisis acompañados de plantillas Excel.

Aquí tienes a disposición una plantilla con los cálculos de la prueba de chi-cuadrado de independencia y de bondad de ajuste.