Regresión Logística en Excel

Abr 20, 2021 | ANÁLISIS, Estadística | 0 Comentarios

Esta regresión se utiliza para responder a preguntas de sí/no, como por ejemplo, comprar o no comprar un producto en función de una o varias variables de predicción, es decir que calcula la probabilidad de que ocurra un acontecimiento (comprar el producto). Cuando tenemos un resultado binario, no podemos llevar a cabo una regresión lineal ya que no se cumplen los supuestos de normalidad de la distribución y la varianza igual para la variable objetivo. Si las variables independientes son categóricas, necesitamos transformarlas en variables ficticias (como describo en este post).

¡No te pierdas ningún nuevo vídeo!

Visita mi canal de Youtube

 En la plantilla, en la primera hoja, utilizo la función de log-likelihood y el complemento de Excel denominado Solver para calcular los parámetros de regresión. Una vez que hayamos obtenido los resultados de la regresión, tendremos que aplicar una función exponencial para obtener las probabilidades de un acontecimiento ya que no podemos utilizar los parámetros directamente. En este caso se trata de una regresión logística con una variable de predicción pero es posible añadir más variables. 

menu importar desde web Power Query

Otra opción es utilizar el complemento gratuito de Real Statistics, que incluye muchas funciones estadísticas entre las cuales la regresión logística. Para descargarlo y las instrucciones de instalación visita esta página web: https://www.real-statistics.com/free-download/real-statistics-resource-pack/

Una vez descargado e instalado, abrimos el complemento Real Statistics (que estará probablemente en la pestaña «complementos»), vamos a la pestaña «Reg» y seleccionamos «Logistic and Probit Regressions». Vamos a utilizar los mismos datos de la primera hoja y en la siguiente imágen puedes ver como he configurado los datos para la regresión. Fíjate que se trata de datos agrupados (summary) dado que no tenemos una fila para cada caso con 0 o 1 como respuesta, sino que los hemos agrupado. Con este complemento puedes también utilizar datos no agregados.

regresion logistica complemento Excel

Seleccionamos el rango de salida y damos a Ok. Se generarán una serie de tablas un un gráfico con la curva ROC. Primero, para determina si es un buen modelo podemos analizar la columna % Correct de la primera tabla y hacernos una idea del nivel de acierto en diferentes niveles de nuestra variable predictora. También podemos ver el global. Además, podemos analizar la curva ROC, cuanto «suba» rápido, mejor será nuestro modelo. Para más información sobre la curva ROC puedes leer Clasificación Binaria Simple en Excel.

regresion logistica resultado complemento Excel

Para poder utilizar los resultados para predecir, tenemos que fijarnos en los coeficientes en la columna B de la segunda tabla (Intercept y Satisfacción). Para predecir la probabilidad, tenemos que utilizar la siguiente fórmula: exp(Intercept + Coeficiente1 *x1) / exp(1 + Intercept + Ceficiente1*x1). X1 es el valor de la variable de predicción que queremos utilizar, por ejemplo un nivel de satisfacción de 0,1 (en la plantilla puedes ver un ejemplo de cómo lo he calculado en Excel). Para los valores que ya tenemos en el análisis (0,1 – 0,2 – 0,3 etc.) ya tienes la información en la columna p-Pred. Por ejemplo, con un nivel de satisfacción de 0,1, la probabilidad de comprar es de un 98%. Utilizar la fórmula es útil si necesitas estimar valores que no estén en esta tabla.

 Tienes a tu disposición una plantilla gratuita con las dos maneras de calcular una regresión logística en Excel, sólo tienes que suscribirte al blog. Recuerda que para utilizar el complemento de Real Statistics tienes que ir a enlace que mencioné anteriormente y seguir las instrucciones.