Los modelos de machine learning con los que trabajas predicen bien, ¿pero sabes por qué?
Me llamo Leonardo Hansa. Me gusta el chocolate, el tiempo libre y llevo más de 3.832 días cobrando por explicar negocios, no por predecirlos.
Te cuento.
Toda las semanas envío un boletín sobre aquello con lo que consigues que tus modelos los pueda entender tu jefe: la estadística. Si trabajas con datos, gráficos, modelos,... escucha.
Lo que mando son ideas sobre herramientas para que tus análisis sean más comprensibles.
¿Para qué sirven eso?
Para que, cuando tus predicciones dejen de tener sentido, ejecución tras ejecución, sepas técnicas para entender qué ha pasado.
Por cierto, lo más socorrido para que tus modelos se entiendan es trabajar directamente sobre tus datos.
Sí, datos. Ni algoritmos, ni modelos encadenados, ni ninguna librería de Python.
¿Sabes cómo predice Spotify qué canción te hará más ilusión escuchar cuando se esté acabando el año?
Contando. Solo eso.
Cuenta cuántas veces has escuchado cada canción y se queda con la que más has escuchado. Y te la pone.
Es un producto de Spotify que lleva años funcionando con éxito. Y solamente es un conteo.
Lo que me recuerda que tengo algo para ti.
Hagas el análisis que hagas, a poco que hayas intentado ajustar un modelo, sabrás que Excel se queda corto.
Tengo un documento en el que relaciono Excel, R y Python.
En él tienes una visualización de datos geográficos y una exploración con una tabla dinámica, en las 3 herramientas.
Así, si sabes una de las 3 herramientas, puedes aprender un poco sobre las otras 2.
Modo Piedra Roseta, como la de los jeroglíficos egipcios.
Suscríbete a mi newsletter y te lo mando.
Mira.
Si lo que quieres es aprender big data, escribir código para coches que se conducen solos, desarrollar inteligencias artificiales que escriben poemas mejor que Shakespeare... no te suscribas.
No te voy a aportar nada en ese caso.
Las personas que sacan partido a lo que cuento son las que trabajan con datos pero no se sienten cómodos con los detalles de sus análisis. Sienten que les falta rigor.
Eso ocurre a menudo por dos cosas:
Quizá has hecho un máster o bootcamp de datos, o te estás planteando hacerlo. ¿Pero es suficiente?
¿Te van a dar la base necesaria para reaccionar cuando un resultado no tenga sentido?
¿O te darán solo recetas?
Si te suscribes, en el primer correo que te enviaré te cuento por qué esos cursos no te encajan. Y cómo montar muebles de Ikea te puede ayudar a meter la programación en tu vida.
O en tu puesto de trabajo, por lo menos.
Si quieres hacerte data scientist, entonces haz un máster.
Si lo que quieres es simplificar tu trabajo, tengo una idea.
Bueno, varias.
En tu bandeja de entrada.
Ahí, más abajo.
Te cuento más sobre el documento que te llevas si te suscribes
Cuando te suscribas, en el correo en el que te explico lo de Ikea, te doy además acceso a un documento.
Se trata de una Piedra Roseta.
La piedra Roseta era eso que usaron para traducir los jeroglíficos egipcios, porque venía el equivalente a otro idioma que ya conocían (¿griego? y algún otro).
Lo que te ofrezco es una comparativa entre Excel, Python y R. Se trata de dos tareas de datos (visualización de un mapa y una especie de tabla dinámica) hechas con esas 3 herramientas.
Llevo más de 10 años enseñando tratamiento y análisis de datos. Decenas de alumnos a los que he dado clase me han enseñado esto a mí: muchos cursos de datos no te sirven para aprender porque no te enseñan los fundamentos del trabajo. Te enseñarán recetas, sí, pero si te cambian el entorno de trabajo, la herramienta, incluso los datos, te bloquearás porque no sabrás qué receta te toca aplicar o cómo tienes que aplicarla.
¿Y sabes por qué es eso?
Porque no te enseñan los fundamentos: aquello que es común a a todas las tareas de programación y de análisis de datos.
En mi Piedra Roseta:
Una vez tengas eso claro, aprender herramientas nuevas te saldrá solo.
Mi Piedra Roseta la aprovecharás sobre todo si te manejas un poco en una de esas 3 herramientas y quieres aprender alguna de las otras. Tendrás una referencia de cómo enfocar esas tareas que te propongo.
¿Sabes que los que trabajan en data science dedican un 80% de su tiempo a preparar los datos? O sea, nada de estar todo el día haciendo modelos chulos. Dedican la mayor parte de su tiempo a poner orden en las tablas.
En la Piedra Roseta te cuento cuáles son mis herramientas favoritas (en R y Python) para dedicarme a ese 80% del tiempo.
Y esas dos herramientas son muy comunes, muy usadas. Así que te vendrán bien.
La piedra Roseta tiene dos documentos:
Para que veas cómo se plantean el gráfico y la tabla dinámica que te propongo.
Por cierto, creo que hago las tablas dinámicas de forma distinta a cómo las haces tú. No es ni mejor ni peor. Es solo distinto :)
Te mando la Piedra Roseta. Solo necesito tu email: