
Análisis de supervivencia
El análisis de la supervivencia se utiliza, por ejemplo, en el campo de la medicina (la supervivencia de los pacientes), de la ingeniería (el tiempo estimado hasta que se rompa un componente) o del marketing (tasa de cancelación de clientes o customer churn rate) para estimar cuándo va a darse un determinado resultado. A la hora de llevar a cabo este tipo de análisis, es importante considerar el concepto de “censoring” (censura), es decir, el problema de que los valores solo sean parcialmente conocidos. Esto es debido al hecho de que, en el momento en que realizamos la estimación, para algunos individuos (u objetos), el acontecimiento ya ha ocurrido mientras que para otros no.
¡No te pierdas ningún nuevo vídeo!
Visita mi canal de Youtube
Dos de las técnicas más utilizadas son el método “Kaplan–Meier” y la regresión de Cox. La primera es una técnica estadística no paramétrica que se utiliza cuando tenemos variables categóricas o cuando el número de observaciones es reducido. El ejemplo desarrollado en la plantilla utiliza esta técnica para calcular la probabilidad de que sobreviva (no se rompa) un componente mecánico una vez transcurridos algunos años. La Figura 27 muestra el gráfico de la curva de supervivencia que representa la función de supervivencia.

Además del gráfico de la curva de supervivencia, es posible utilizar una tabla de vida para analizar los resultados. Esta tabla contiene el número de años, el número de eventos, el porcentaje de supervivencia, el error estándar y los intervalos de confianza. En caso de que necesitemos comparar la función de supervivencia de dos grupos, podemos utilizar el log-rank test (o prueba logrank o de Mantel-Cox) para comprobar si las dos curvas son considerablemente distintas.
Si el número de observaciones es elevado y queremos incluir variables explicativas adicionales, entonces deberíamos utilizar una regresión de Cox.
El análisis de la supervivencia puede resultar muy útil cuando necesitamos priorizar esfuerzos. Por ejemplo, podemos estimar cuándo están los empleados a punto de marcharse de la empresa utilizando una regresión de Cox con varias variables explicativas (años en la empresa, número de proyectos, satisfacción, desempeño, etc.). Podemos así crear una matriz utilizando la función de supervivencia, por un lado, y el desempeño, por otro, y centrar nuestros esfuerzos en aquellos que muestran tanto un nivel elevado de desempeño como una alta probabilidad de marcharse.
Para este tipo de análisis, necesitamos un seguimiento específico del “tiempo de supervivencia” del objeto en cuestión. También podemos obtener estos datos en un CRM, por ejemplo, con las altas y las bajas de clientes de un determinado servicio.
Este post se basa en mi último libro “The Art of Data Analysis: Non-Technical Sills for Data Analysts” clasificado cómo mejor nueva publicación en las categorías Business y Matemathics en Amazon.com en agosto 2020 (#1 New Release in Business Mathematics)