CÓMO CREAR UN BUSINESS INTELLIGENCE GRATUITO

Abr 11, 2021 | DATOS, Importar y transformar | 0 Comentarios

Tradicionalmente, para crear un sistema de Business Intelligence era necesaria una importante inversión en procesos y herramientas para:

  • Extracción y transformación de los datos desde las fuentes de datos;
  • Almacenamiento en servidores locales (ahora en cloud);
  • Modelado de datos y explotación a través de herramientas de visualización.

Sin embargo, estas soluciones no son muy adecuadas para PYMEs,  o al menos los negocios que manejan un volumen de datos limitado, y cuyo modelo de negocio no se basa principalmente en la explotación de los datos. Hablo por ejemplo del pequeño comercio, de la hostelería (bares, restaurantes, hoteles pequeños), de empresas de servicios, fábricas etc.

¡No te pierdas ningún nuevo vídeo!

Visita mi canal de Youtube

 La buena noticia es que desde hace unos años ha surgido una serie de herramientas de nueva generación como Power BI, Tableau, QlikView, Sisence etc. que permiten la explotación de los datos de manera más independiente y a diferentes escalas. La ventaja de estas herramientas es que incluyen también funcionalidades de extracción, transformación de los datos y de modelado de datos. Así que si lo combinamos con un almacenamiento barato en la nube podemos montar un sistema de BI con poca inversión o incluso gratis.

A continuación voy a explicar como podemos crear un sistema de Business Intelligence completamente gratuito utilizando las versiones gratuitas de Power BI para la transformación y modelado de los datos, y Google Drive para su almacenamiento. Antes de seguir, es importante que te diga qua hay limitaciones. Si quieres algunas funcionalidad más avanzada o almacenar más datos tendrás que incurrir en algún coste.

PASO 1: DESCARGAR LAS HERRAMIENTAS

Primero descargamos Power BI desktop de forma gratuita al siguiente enlace: https://www.microsoft.com/en-us/download/details.aspx?id=58494

Una vez descargado Power BI, podemos abrir y empezar a usar esta herramienta. Para darse de alta (necesario para incorporar nuevos tipos de gráficos, o subir los datos al servidor de Power BI) es necesario un correo electrónico no personal (que no sea Hotmail, Gmail etc.). Si tienes uno puedes aprovecharlo, otra manera es, si tienes un dominio, puedes crear un alias con una cuenta de correo personal, o puedes contratar el servicio de correo profesional de Microsoft, Google etc. De todas formas, no es imprescindible para crear nuestro sistema de BI.

Segundo, descargamos Google Drive que nos ofrece hasta 15 GB gratuitos de almacenamiento en la nube (puedes también utilizar otros servicios que ofrecen cierto espacio de almacenamiento de forma gratuita como OneDrive): https://www.google.com/intl/es/drive/download/

Iniciamos sesión en Google Drive. Si dispones de una cuenta de correo de Google (Gmail) puedes iniciar sesión con ella, de lo contrario, puedes crearte una de forma gratuita. Ahora tendrás una carpeta en tu ordenador donde, al guardar nuestro archivo de Power BI, este se guardará también en la nube.

PASO 2: DEFINIR EL MODELO DE DATOS

Antes de empezar a crear cualquier cosa, hay que entender bien el negocio y como sus necesidades pueden ser satisfechas a través de los datos. Por ejemplo, si ofrecemos 10 tipos de productos y tenemos que decidir a cuáles productos dedicar más recursos (publicidad, desarrollo etc.) entonces debemos disponer de datos en cuanto al número de ventas por producto en el tiempo, para ver que productos se venden más y su tendencia a lo largo del tiempo (ganan o pierden popularidad) etc. Es importante definir en un principio que queremos saber de los datos. Aquí tienes una serie de posts relacionados con el conocimiento del negocio: https://datafluency.academy/category/negocio/

menu importar desde web Power Query

Después hay que identificar las fuentes de datos de donde podemos sacar la información para contestar a las preguntas anteriores. Para definir buenas preguntas puedes echar un vistazo a este post https://datafluency.academy/como-empezar-un-analisis-de-datos/.

Ahora tenemos que definir el modelo de datos. Para ello, tenemos que saber primero con que formato y si podemos descargar los datos en diferentes tablas o no. Para ello, vamos a Power BI, clicamos “Obtener datos” y verás que salen unas cuantas opciones, también puedes clicar en más opciones. Lo ideal es que haya un conector a la herramienta de tu fuente de datos, por ejemplo, Google Analytics, o a la base de datos donde se están guardando tus datos transaccionales (backoffice de ventas) como por ejemplo SQL Server. De esta forma puedes crear conexiones a estos datos e importarlos directamente en el archivo de Power BI.

Sin embargo, si no existe un conector, tienes dos opciones manuales:

  • Importar datos desde un Excel: puedes guardar en una hoja Excel de manera periódica los datos que necesitas importar. Este archivo Excel lo tienes que guardar en la carpeta de Google Drive de tu ordenador y después crear una conexión desde Power BI especificando la hoja desde la cual quieres importar los datos. Después, cada cierto tiempo (por ejemplo cada semana) irás añadiendo filas a tu Excel y al dar a actualizar en Power BI se cargarán los nuevos datos.
  • Importar los datos desde una carpeta: esta opción es muy interesante dado que Power BI permite juntar todos los datos de los archivos de una carpeta. La ventaja es que puedes simplemente  descargar los datos en CSV (o TXT, o Excel) de una herramienta, guardarlos en una carpeta, y Power BI los juntará y cargará solo, sin tener tú que abrirlos y juntarlos en un Excel cada semana o mes. Para ello, tienes que crear una carpeta en Google Drive, e ir guardando los archivos (es importante que tengan el mismo formato y estructura de datos).

Si recurres a esta opción manual, puedes aprovechar el hecho de guardar los datos en Google Drive y compartir la carpeta donde almacenas los datos, de esta manera otras personas podrán también guardar los archivos nuevos o actualizar el Excel. Si es otra persona que los añade, cuando vayas a actualizar Power BI tendrás que esperar esperar que la carpeta correspondiente en tu ordenador se actualice.

Ahora que has identificado las fuentes de datos y las conexiones, hay que definir el modelo de datos. Esta fase es muy importante y si no tienes experiencia en ello, te aconsejo que te ayude algún profesional. El objetivo es relacionar las diferentes fuentes de datos de manera que la explotación sea eficiente y no se generen duplicidades o datos incorrectos. Si eres nuevo en esto, aquí explico los conceptos principales de un modelo de datos https://datafluency.academy/conceptos-base-de-un-modelo-de-datos/.

Generalizando, tenemos dos opciones:

  • Crear una tabla grande donde hemos cruzado todos los datos utilizando el editor de consultas de Power BI (Power Query).
  • Crear un modelo de datos definiendo relaciones entre tablas de dimensiones y una o más tablas de hechos (modelo de estrella o copo de nieve).

La primera opción es viable si nuestro modelo de datos es bastante simple y el volumen de datos es limitado. Sin embargo, esto requiere saber manejar bien el editor de consultas de Power BI, si no lo conoces puedes echar un vistazo a mi post sobre como anexar y combinar tablas en Power Query https://datafluency.academy/anexar-y-combinar-tablas-en-power-query/.

La segunda opción es, en general, la más adecuada, sobre todo para poder escalar a futuro nuestro modelo de datos, por ejemplo, añadiendo nuevas fuentes de datos o tablas. El esquema más simple es cuando tenemos una tabla de hechos (que representa las métricas, o las acciones, por ejemplo las transacciones, con su importe, la cantidad etc.) a la cual se relacionan unas cuantas tablas de dimensiones. Un ejemplo de tabla de dimensiones es una tabla calendario, donde, para cada fecha de la tabla de hechos (la fecha de una transacción), añadimos columnas del día de la semana, del mes, del año, del trimestre etc. Otro ejemplo, son las características de un producto, cuando en la tabla de hechos tienes el código de producto, y en la tabla de dimensiones su nombre, características,  precio etc. Para crear este modelo, es posible que tengamos que modificar los datos al importarlos en el editor de consultas. En este post explico las posibilidades de transformar los datos en Power Query en Excel (que es similar al editor de Power BI) https://datafluency.academy/transformar-datos-con-power-query/.

Sin embargo, a menudo tenemos más de una tabla de hechos, y la relación entre tablas se puede complicar un poco. Si las tablas de hechos comparten dimensiones comunes, las podemos relacionar a través de tablas de dimensiones intermedias, siempre teniendo cuidado de los tipos de relaciones (uno a uno, uno a muchos etc.) para que no se dupliquen los datos.

Una vez relacionadas todas las tablas, lo ideal es ocultar las columnas duplicadas para que el usuario no tenga que ver duplicidades a la hora de crear visualizaciones de datos en Power BI. Para ello, podemos ir a las columnas de las tablas generadas en Power BI, clicar con el botón derecho,  y ocultarlas. Lo que queremos ocultar son principalmente las columnas en las tablas de hechos que utilizamos para relacionar las tablas de dimensiones. En el ejemplo anterior de la tabla calendario, ocultaremos de la tabla de transacciones la fecha, dado que utilizaremos la de la tabla calendario.

PASO 3: CREAR CUADROS DE MANDO

Una vez definido el modelo de datos vamos a definir unos cuantos cuadros de mando con diferentes visualizaciones dependiendo de lo que queremos analizar. Es un tema muy amplio para poder incluirlo en este post, pero por lo general tienes que pensar en:

  • Qué quieres medir: las métricas, por ejemplo número de ventas, importe de las ventas, etc..
  • La comparativa: vs el mes anterior, un producto vs el resto en el mismo periodo de tiempo etc.
  • Cuándo: cada mes, cada semana etc.
  • Segmentación: qué categorías utilizar para segmentar los datos (tipo de producto, área geográfica etc.)
  • Filtros: además de los gráficos, puedes usar filtros para que el usuario selecciones un conjunto de datos específico, por ejemplo excluyendo un tipo de producto.

PASO 4: ACTUALIZAR Y COMPARTIR

Para actualizar los datos, si has optado por una de las opciones manuales, tendrás primero que actualizar el Excel o descargar el nuevo archivo y guardarlo en la carpeta correspondiente. Como he comentado antes, varias personas pueden encargarse de la descarga de los datos. Después, en Power BI simplemente tienes que dar a “Actualizar” en el menú principal y guardar el archivo Power BI para que otros puedan consultar los datos. Si más de una persona actualiza el Excel, los archivos de la carpeta o Power BI, hay que tener cuidado para no modificar el mismo archivo a la vez dado dado que se pueden generar conflictos de versiones.

Para compartir los datos, aprovechamos el uso de Google Drive. Compartimos el archivo de Power BI o la carpeta donde está con las personas que lo van a visualizar. Es importante destacar que con esta solución no podemos tener un control de accesos y permisos, así que cada persona podría modificar el archivo de Power BI común (sincronizado en todos los ordenadores y en la nube). Otra opción, es que el archivo original de Power BI no se comparta, sino que se comparta solo la carpeta con el Excel o archivos de fuentes de datos. Cada persona tendrías una copia del archivo de Power BI donde puede modificar a su gusto las visualizaciones. La desventaja de esta opción es que si el modelo de datos cambia y van a necesitar un nuevo archivo de Power BI, no podrán utilizar las modificaciones que han ido haciendo (a menos que repliquemos los cambios del modelo en su archivo personal).

¿Necesitas ayuda para crear tu sistema de Business Intelligence? No dudes en contactarme a info@datafluency.academy , te contestaré con alguna sugerencia sin compromiso. Si después quieres que te ayude más, lo hablamos, de lo contrario estaré encantado de haberte echado una mano con alguna sugerencia.