10 consejos para una buena estrategia de datos

Oct 9, 2021 | ESTRATEGIA | 0 Comentarios

Hace unos días participé a la openclass de Javier Monjas, Analytical Lead en Aggity y profesor del Máster en Business Intelligence & Data Management de Inesdi Digital Business School. No voy a resumir toda la presentación (al final del post puedes verla), pero quería comentar la parte más interesante, a mi juicio: los 10 consejos de Javier Monjas para implementar una buena estrategia de datos.

¡No te pierdas ningún nuevo vídeo!

Visita mi canal de Youtube

  • Saber de qué datos disponemos: antes que nada, es importante identificar la materia prima de la que disponemos y si es más o menos fácil acceder y cómo. Además, no hay que olvidarse de comprobar el histórico dado que es crítico si queremos desarrollar modelos predictivos, por ejemplo. En fin, no hay que olvidar la famosa frase “garbage in – garbage out”, y con esto me refiero a la calidad del dato. Lo peor es tener datos pocos fiables y no saberlo. Si conocemos los problemas podemos corregirlos, evitar utilizar los datos pocos fiables o, al menos, reconocer las limitaciones de nuestros modelos a la hora de tomar decisiones.
  • Arrancar lo antes posible: a veces no es factible tener todo perfecto, con una visión global de todo, y con todos los datos y recursos disponibles. A menudo es necesario empezar lo antes posible con algo más acotado. En estos casos el consejo es encontrar algo de gran valor para el negocio y cuyo desarrollo sea relativamente sencillo y rápido. Esto nos permite empezar con unos quick-wins gracias a los cuales conseguiremos a la vez producir impactos positivos en poco tiempo y ganarnos la confianza de quienes toman las decisiones de negocio.
  • Subirse a la ola: llevamos ya varios años hablando de la ventaja competitiva que una empresa puede obtener de los datos. Ya no vamos a ser los pioneros si empezamos ahora, pero tenemos que subirnos al carro lo antes posible. La cantidad de datos de las que disponemos (o podemos disponer) es brutal, la tecnología es cada vez más avanzada y sencilla para el usuario, y no podemos arriesgarnos a perder esta oportunidad. Quedarse atrás ahora significa comprometer nuestra competitividad futura.
  • Mirar el futuro con perspectiva: la ley de Moore sobre el incremento de capacidad de almacenaje ya se ha quedado desfasada. Esto para decir que todo está evolucionando más rápido de lo que podemos predecir para el futuro. Hay que afrontar una estrategia de datos con una mentalidad abierta y sabiendo que el futuro nos puede reservar sorpresas. Por ejemplo, una tecnología que estamos usando hoy, mañana se podría quedar obsoleta, o en pocos años podríamos tener que analizar un volumen mucho mayor de datos y nuestra infraestructura no puede adaptarse facilmente. Por ello, hay que intentar desarrollar soluciones flexibles que nos permitan evolucionar junto con la tecnología.
  • Preguntarse todo: viene muy al caso la famosa frase de Donal Rumsfield que dice que hay cosas que sabemos que sabemos, cosas que sabemos que desconocemos, y cosas que no sabemos que desconocemos. Por ello, es crítico preguntarse todo, en particular el “Porqué” de las cosas: ¿Por qué esta variable tiene esta distribución? ¿Por qué esta muestra tiene una media mayor que la otra? ¿Por qué el coeficiente de esta variable es positivo cuando por sentido común debería ser negativo? ¿Por qué el modelo ajusta tan bien? Es haciéndonos preguntas cuando podemos descubrir algunos de los unknown unknowns (cosas que no sabemos que desconocemos).
  • Tener una visión global: Javier cuanta la historia de los 5 ciegos donde cada uno está tocando una parte diferente de un elefante y todos tienen una idea diferente de lo que es. Todos tienen razón y están equivocados a la vez, pero nadie tiene la visión global que podrían obtener hablando entre ellos. Es fundamental hablar con las personas más cercanas al negocio y personas de otras áreas para tener una visión global de los problemas, saber cuáles son las prioridades, conocer las limitaciones de nuestros análisis etc. La falta de visión de negocio es también uno de los motivos principales de fracaso de una estrategia de datos que expliqué en un reciente post.
  • Huir de los caminos rápidos: a veces puede ser muy alentador tomar un atajo, cómo no comprobar suficientemente la calidad de los datos, o los requisitos de un modelo, o utilizar sólo los datos de fácil acceso etc. Pero esto nos puede costar caro a largo plazo. Podemos desarrollar un modelo sub-óptimo y tener que rehacerlo de nuevo o generar una situación de la cual es complicado volver atrás. Hay que hacer las cosas bien, comprobando lo que haya que comprobar y siguiendo los pasos necesarios.
  • Buscar la simplicidad: “más complejo” no quiere decir “mejor”, es más, incluso si un modelo complejo ajusta un poco mejor, la solución ideal podría ser un modelo más sencillo y con peor ajuste. A la hora de crear y poner en producción algo hay que tener en cuenta otros factores, cómo los recursos necesarios para su desarrollo, puesta en producción y mantenimiento. Además, es muy importante la interpretabilidad de este modelo para poder explicarlo a los responsables de negocio. Encontrar un modelo sencillo, que ajuste bien, interpretable, y fácil de mantener puede ser más difícil que crear un modelo complejo.
  • Hacer llegar la información: el objetivo no es crear un cuadro de mando bonito, un informe impactante, o un modelo innovador, lo que hay que hacer es transmitir información orientada a la acción para que se puedan tomar mejores decisiones o para tener un impacto positivo en el negocio. Todo proyecto de datos necesita ser oriento a la acción. Por ejemplo, cuando creamos un gráfico o un KPI, tenemos que preguntarnos ¿Para qué? ¿Qué decisión puedo tomar con esto? Si no hay respuesta, quiere decir que no es información relevante.
  • Cuestionarlo todo: no hay que dar nada por sentado, si me dicen que los datos están bien, tendré que comprobarlos de todas formas. Si se establece que un modelo tiene que recalibrarse cada año, lo comprobaré a los seis meses a ver si es verdad. Si un modelo ajusta bien, no lo implementaré y me olvidaré después, sino que lo comprobaré durante un tiempo después de su puesta en producción. Recuerda que un análisis o un modelo son solo una simplificación de la realidad, y esto ya tiene sus limitaciones. Si, además, no comprobamos que todo esté bien atado, el riesgo de equivocarse es muy alto. Cómo científicos de datos, analistas, CDO etc. tenemos que ser también un poco “policías” que no nos fiamos de nada y de nadie, y que todo lo tenemos que comprobar y contrastar.