Regresión Múltiple para decidir qué servicios mejorar

Oct 26, 2021 | casos prácticos | 0 Comentarios

Las encuestas de satisfacción son un elemento muy útil para monitorizar las opiniones de los clientes y ver el grado de satisfacción y recomendación. Podemos incluso analizar la tendencia y ver si alguna acción mejora o empeora los KPIs. Pero podemos ir más allá, es decir analizar los datos de manera que nos ayuden a decidir que servicios mejorar. Es lo que hice hace unos años utilizando el grado de satisfacción de los viajeros de un tren en diferentes ítems (limpieza, restauración, precio etc.) y la propensión a recomendar.

¡No te pierdas ningún nuevo vídeo!

Visita mi canal de Youtube

Ya hablé en otro post de cómo la regresión lineal múltiple es un óptimo instrumento para definir y diferenciar los efectos de diferentes variables independientes para estimar una variable dependiente. Antes de seguir, si no estás familiarizado con esta técnica estadística, te aconsejo leer ese post.

En este caso práctico, el objetivo no era estimar la recomendación en base a la satisfacción de diferentes ítems, sino definir la importancia relativa de cada uno de estos ítems. Gracias a esto, sería posible priorizar los esfuerzos de inversión en los principales factores que afectaran a la recomendación global.

Antes que nada, ¿Por qué la recomendación? Otra opción habría sido usar como variable dependiente la satisfacción global, sin embargo, la recomendación parecía más apropiada para los siguientes motivos:

  • Los clientes con alta propensión a recomendar también tenían un alto nivel de satisfacción global. Por lo que podríamos deducir que la recomendación también incluye la satisfacción.
  • La recomendación es más valiosa para este tipo de negocio dado que la mayoría de los clientes son nuevos (pocos repetidores) y por ello la recomendación ayuda a aumentar el flujo de nuevos viajeros.

Sobre este último punto, también estimamos el valor de la recomendación. Primero calculamos que se conseguía un nuevo cliente cada 5 recomendaciones. El calculo consistía en dividir el porcentaje de viajeros que han conocido el servicio gracias a una recomendación entre el NPS, es decir “% recomendados / % recomendantes” (el Net Promoter Score es el porcentaje neto de clientes que recomiendan). Este cálculo obviamente no es exacto, dado que el impacto de la recomendación no es inmediato y deberíamos calcularlo en momentos diferentes, pero analizando los datos globales de un año se puede hacer una buena aproximación. El segundo paso fue calcular el ahorro en publicidad, calculando el coste medio de adquisición de un viajero y multiplicándolo por el total de viajeros conseguidos con las recomendaciones.

Una vez definida la importancia de la recomendación, era el momento de preparar los datos y realizar la regresión. Al final del post puedes descargar la plantilla con los datos y los cálculos, pero ten en cuenta que los datos han sido manipulados por confidencialidad.  La regresión original tenía mejores resultados de R cuadrado (0,60) y este ejemplo servirá para mostrar el proceso de análisis, pero no será sobre los resultados concretos de este estudio.

En la plantilla Excel verás que tenemos en la hoja Datos las diferentes variables. En la primera columna tenemos la recomendación (de 0 a 10) y en el resto de columnas la satisfacción que ha sido transformada desde una escala Likert de 5 niveles a un valor de entre 1 y 5 (para más información sobre la investigación de mercados aquí tienes varios artículos interesantes).

Realizamos la primera regresión con el complemento Análisis de datos de Excel y vemos (obviando el tema el R cuadrado) que los coeficientes son todos positivos, cosa que tiene su lógica: cuanto mejor la satisfacción en un ítem, tanto mayor la recomendación. Siguiendo con el análisis, detectamos un par de problemas. El primero es que la satisfacción del viaje es el coeficiente con más importancia, pero si lo pensamos lógicamente, este incluye muchos de los otros ítems, por lo que es mejor excluirlo para no “solapar” efectos. El segundo problema es que tenemos dos variables no significativas (cuyo p-valor, es mayor a 0,05): Ambiente bar y Limpieza bar. Así que vamos a realizar una segunda regresión, pero sólo eliminando la variable de satisfacción del viaje.

En esta regresión vemos que sólo queda una variable no significativa, esto se debe gracias a la eliminación de la variable Viaje que estaba impactando al resto de efectos y que probablemente los “cubría” en parte. Ahora sólo nos queda quitar la variable Limpieza bar para la última regresión (es importante quitarla en lugar de ignorarla dado que el resto de coeficientes puede variar). Obtenemos así la regresión final.

El último paso es definir la importancia relativa de las variables utilizando los coeficientes. Vemos, por ejemplo, que el precio tiene un coeficiente de 0,25. Esto quiere decir que por cada unidad que aumente la satisfacción del precio, la recomendación mejora 0,25 puntos. Para calcular la importancia relativa dividimos cada coeficiente por la suma de los coeficientes obteniendo un porcentaje. En nuestro caso es más fácil porque todos son positivos, pero si tuviéramos alguno negativo lo tendríamos que transformar en valores absolutos (todos positivos).

En nuestro ejemplo vemos que el precio, las estaciones, la restauración, y la seguridad son lo más importante. Así que si tuviéramos que investigar más donde invertir para mejorar el servicio empezaríamos por ahí. Este estudio lo utilizamos precisamente para ello y sirvió de base para el plan de mejora de servicios a bordo.