9 min read

Primeros pasos en análisis de datos

Si estás aquí, es que eres un profesional orientado a negocio y quieres ampliar tu campo.

Si consigues basar tus recomendaciones de negocio en datos, tendrás más capacidad de convicción entre tus círculos.

Para eso te sirve el análisis de datos. Y querrás formar en el tema, pero estarás saturado de la cantidad de oferta que hay y no saber por dónde empezar. Seguramente incluso ya te habrás planteado que tú ya haces análisis de datos, aunque tu puesto no sea de data analyst.

Aquí te cuento qué puedes hacer para meterte un poco en el sector –pero sin dejar de ser el profesional de tu campo que ya eres.

Índice

Introducción al Análisis de Datos

Vale, sí, ya has oído hablar del análisis de datos. Pero ni idea de qué es, ¿no?

Luego lo vemos. Lo primero es por qué importa el análisis de datos.

Pues importa simplemente porque ya lo haces. Haces tablas dinámicas en Excel y pegas gráficos y tablas en PowerPoint.

El análisis de datos sirve para saber si lo estás haciendo bien. Por ejemplo, que no estés manipulando con un gráfico, o que una tabla la pueda leer correctamente tu público.

¿Qué es el Análisis de Datos?

Vale, ahora sí. ¿Qué definición puedes dar al anáisis de datos?

No hay una definición clara, por supuesto. La idea es que incluye un conjunto de herramientas orientadas a entender mejor un negocio gracias a los datos.

Pero no lo confundas con la ciencia de datos. Tiene mucho en común, y no hay ciencia de datos sin análisis. Pero me gusta pensar que un científico de datos debería ser capaz de hacer modelos complejos con fines predictivos, mientras que un analista de datos puede conformarse con entender el pasado. Entre sus tareas estaría cuantificar el efecto de unas variables sobre otras o hacer inferencia estadística.

Herramientas Esenciales para el Análisis de Datos

Las herramientas del análisis de datos dan igual. En algunos casos podrías hacer análisis de datos con Excel. Aunque te vas a ver limitado en cuanto tus datos crezcan un poco, o cuando tengas muchos ficheros y quieras automatizar las cosas.

Es mejor que vayas a R ó Python. Dicen que herramientas de tableros o dashboards, como PowerBI, son la clave para un analista de datos. Pero también se te puede quedar corta porque la automatización de tareas la vas a hacer mejor con un lenguaje de programación.

Para aprender R o Python, a los suscriptores de mi newsletter les ofrezco cursos míos, basados en un método que llevo desarrollando casi 10 años, orientado al tratamiento de datos para su análisis.

Comenzando con Excel para Análisis de Datos

Sí, ya, me lo sé: que no vas a aprender a programar porque lo tuyo es negocio y necesitas Excel siempre.

Vale, haz lo que quieras, pero por lo menos usa Excel bien. Aprende a automatizar bien. Y no me refiero a que programes en Visual Basic. Me refiero que sepas bien las fórmulas.

Aprende a montar una tabla en Excel, para luego hacer gráficos dinámicos que te ayuden en tus informes. Y anímate con funciones como INDEX, MATCH o OFFSET. Tienen curva de aprendizaje pero te ayudarán a analizar datos con Excel con mucha más libertad que con tablas dinámicas.

Introducción a R para Análisis de Datos

Si te animas a programar un poco, tu potencial se disparará. Recomendación: como primer paso aprende un solo lenguaje. Y que sea R ó Python.

Python está más generalizado pero R está especializado en estadística. Si solo quieres automatizar unas tareas, te da igual. Pero si tu objetivo es analizar datos con rigor estadístico, R te va a ayudar de forma más directa.

Mi recomendación es que empieces por tidyverse para hacer análisis de datos con R.. Aparte de mis cursos que ofrezco en la newsletter, envío links con tutoriales y tutoriales de primeros pasos.

Conceptos Básicos de Estadística para Análisis de Datos

Sí, un poco de estadístíca deberías saber. Por ejemplo:

  • Diferencia entre media y mediana
  • Cuándo usar la moda
  • Cómo interpretar a desviación típica
  • Cómo interpretar un intervalo de confianza

Necesitas algo de estadística básica para poder meterte en análisis de datos.

Visualización de Datos: Herramientas y Técnicas

La visualización de datos está infravalorada porque se usan muchas tablas. Es normal: tenemos menos datos de los que creemos. Por ejemplo, si quieres poner cómo han evolucionado las ventas de tu departamento en los últimos 3 años, y pones el total anual, tienes 3 números…

¡Haz una tabla para eso! No hagas un gráfico de 3 columnas, alma de cántaro.

Me da igual qué herramienta de visualización de datos uses. Intenta ser consistente, porque quedará raro que uses estilos diferentes. En cualquier herramienta puedes hacer gráficos que queden chulos, no te preocupes, que no quedarán cutres. Pero será mejor que sea siempre igual.

Imagino que el estándar en tu trabajo es PowerBI o Excel. No lo veo mal: no hace falta que te enfrentes a la curva de aprendizaje de R Shiny, por ejemplo. Pero es importante que dediques tiempo aprender técnicas.

O sea, aprende las buenas prácticas de visualización, ten en cuenta que el ojo humano distingue mal tamaños (de burbujas, por ejemplo) pero bien las posiciones (alturas de barras, o líneas en gráficos que comparten un eje y).

Proyectos Prácticos para Aplicar lo Aprendido

Dicen que si te metes a una entrevista para analista de datos querrán mirar los proyectos de análisis que tienes en GitHub. Pero es mentira: eso lo miran cuatro frikis.

Tú además no quieres hacer procesos de selección de analista de datos, sino que buscas que te valoren más en tu trabajo. En ese caso, los proyectos te servirán para aplicar habilidades.

Suelen recomendar Kaggle para buscar conjuntos de datos. A mí me parecen un horror, y hay tantas cosas que me pierdo.

Me gustan más los conjuntos de datos de Datacamp. Y también están muy bien los conjuntos de datos del paquete rethinking de R, o ISLR, del libro Introduction to Statiscal Learning.

Datacamp tiene mejor repositorio que Kaggle para aplicar habilidades de análisis de datos

Recursos y Comunidades Online para Aprender Más Análisis de Datos

Si ya has trabajado un poco con Excel y cosas así en el trabajo, enseñando algún análisis que has hecho, quizá no te merezca la pena hacerte un curso muy completo. Creo que es mejor que hagas cursos breves o tutoriales sobre temas muy concretos, y vayas tirando con eso.

¿Por qué? Porque es lo que mejor vas a aplicar.

Si te haces un curso muy largo, te costará aplicarlo y lo olvidarás.

Por eso es mejor que te apoyes en cursos breves y tutoriales, que tienen buenos recursos de análisis de datos.

Como ya he dicho, en mi newsletter comparto recursos gratis y de pago. Y si prefieres puedes buscar comunidades online activas. Si te interesa R, yo participo activamente en R Hispano y soy socio de Python España. Desde su webs puedes ver qué actividades organizan.

Consejos para Continuar tu Aprendizaje en Análisis de Datos

La clave es el aprendizaje continuo. Por eso es importante que no te líes a hacer mil cursos grandes. Estudia solo que necesitas que vayas a aplicar en un proyecto y céntrate en eso. No intentes abarcar demasiado.

Si buscas consejos de análisis de datos, lo mejor que puedes hacer es dejarte llevar por las necesidades de tu negocio. Soluciona con datos problemas de tu negocio y aprende constantemente pero de poco en poco. Lo mejor es que estés atento a qué cosas hay en el mercado pero sin profundizar. Cuando te toque aplicarlo, entonces sí, aprende en detalle.

¿Cuál es el primer paso para realizar el análisis de datos?

Si ya t quieres poner a analizar los datos, tu primer paso debería ser crearte una tabla con todo. Parece una tontería pero te obligará a entender qué tienes como observaciones y qué métricas tienes. En muchas ocasiones las empresas no saben ni definir eso.

¿Cuáles son las etapas del análisis de datos?

El análisis de datos es una forma de trabajar en sí misma. No hay etapas. Es un continuo de buscar datos, procesarlos y explorarlos. Nunca terminas.

¿Cuáles son los pasos para realizar un análisis?

Los pasos para el análisis de datos son buscar los datos, entenderlos, preguntar a otras personas, procesarlos, explorarlos, visualizarlos, aplicarles modelos... pero no los veas como pasos seguidos, sino continuos. Tendrás que volver a cada paso constantemente.

¿Cómo es el proceso de análisis de datos?

Es largo y continuado. No tienes etapas especialmente definidas, sino que el proceso de extracción y exploración de datos es un continuo.




Si te ha gustado esto, te gustarán mis correos. Para recibirlos te suscribes aquí: