
¿Cualquiera puede ser científico de datos?
Hace unas semanas tuve una conversación interesante con Marcos que acababa de comprar mi libro “The Art of Data Analysis” y que necesitaba unos consejos para empezar en el mundo de la ciencia de datos. Durante la conversación surgieron unas preguntas que escucho a menudo: “¿Es tarde para empezar en análisis de datos?, Tengo experiencia en XXX, ¿es posible aprender ciencia de datos?, ¿No he trabajado nunca con los números, puedo ser analista de datos?
¡No te pierdas ningún nuevo vídeo!
Visita mi canal de Youtube
Primero, creo que nada (o casi nada) es imposible, tanto menos aprender una profesión que, a pesar de unos aspectos técnicos, no es algo tan complejo como podría ser medicina, astrofísica u otra carrera muy especializada. Segundo, yo mismo empecé con una carrera en idiomas y literatura para después pasar a economía y en fin a la ciencia de datos, así que no importa demasiado la formación o experiencia que tengas, aunque pueda ayudar algo. Tercero, la respuesta depende básicamente de dos cosas: pasión y determinación.
Así que a la pregunta de si “¿Todos pueden ser científicos de datos? respondería con un “Sí y no”. “Sí”, porque no hay restricciones basadas en la experiencia anterior o en la formación que tengamos. “No”, porque depende de si es para ti, si te gusta o te apasiona el mundo de los datos. No nos vamos a engañar, si no eres de números y no tienes experiencia en esto va a costar más llegar, por ello es fundamental que sea algo que te guste lo suficiente para poder dedicarle tiempo y esfuerzo. Si no hay pasión, será muy complicado tener la determinación para seguir estudiando y luchando para llegar a ser científico de datos.
Y ahora me dirás, pero ¿Cómo puedo saber si esto me apasiona? La única manara es empezar. Al principio puede resultar frustrante, sobre todo si no das con los cursos o experiencias adecuadas para un principiante, pero te aconsejo que intentes al menos durante unos 5-6 meses para ver si realmente te gusta.
Para ser científico de datos vas a tener que combinar cuatro áreas de conocimientos:
- conocimiento del negocio: esto no es algo técnico y sólo lo podrás conseguir con la experiencia, pero es algo crítico a la hora de ser un buen científico de datos. Necesitas poder entender las dinámicas de un sector y una empresa, cuál es el modelo de negocio, qué representan los datos etc.
- estadística y machine learning: tienes que conseguir una base sólida de estadística sobre la cual podrás profundizar más utilizando modelos de machine learning para análisis más complejos. Esto puede parecer muy difícil si no eres “de números” pero en la realidad no es necesario tener una carrera en matemáticas, sino que hay que aprender unos cuantos conceptos básicos de estadísticas que suenan más complejos de lo que realmente son.
- programación: aunque en un principio te puedes apañar con Excel o cualquier otra hoja de cálculo, cuanto más avances, más será necesario saber programar. Lo básico es tener conocimientos de SQL, un lenguaje muy utilizado para conseguir información de bases de datos estructuradas. Además, suele ser necesario el uso de un lenguaje para el análisis de datos, como R o Python. Si nunca has programado, R te resultará más intuitivo, ¡pero eso es tema para otro post!
- Herramientas de análisis y visualización: esto normalmente no forma parte de las tres áreas “clásicas” de la ciencia de datos porque puedes realizar estas tareas con la sola programación, pero a menudo los científicos de datos también tienes conocimientos de herramientas de hojas de cálculo, como Excel, y de Business Intelligence como PowerBI, Tableau, Qlik, Looker etc. Además, hay también herramientas de estadística y machine learning que permiten el análisis de datos sin programar, como por ejemplo SPSS o SAS.
Mi último consejo, por si quieres empezar ahora mismo, es lo siguiente:
- apúntate a uno de los muchos cursos online de estadística básica (puedes encontrar varios gratuitos en Coursera por ejemplo);
- si no conoces Excel, apúntate a un curso básico, mejor si focalizado en el análisis de datos;
- date de alta en Datacamp donde puedes acceder de forma gratuita a los cursos básicos de SQL y R. Si después ves que te gusta, puedes pasar a la versión de pago (a menudo hay ofertas).
Espero que este artículo te ayude a empezar o continuar tu viaje hacia la ciencia de datos y si necesitas algún consejo más deja un comentario aquí abajo y contestaré lo antes posible.