Datathon Cajamar

A estas alturas mis fieles lectores del blog ya sabrán que me es imposible quedarme quieta, solamente haciendo los proyectos establecidos por X plan de estudio de turno. Así que por si no hubiese sido ya suficientemente tortuosa los meses de febrero y marzo de este Máster en Ciencia de Datos, mis compañeros y yo nos apuntamos al Datathon de Cajamar bajo el nombre de OutliersCanariones.


¿Datathon? os preguntaréis, sí. Datos + Maratón = Datathon. Para mí que ya estoy acostumbrada a participar en jams para hacer un videojuego en 48 horas sobre un tema en concreto, un Datathon no es más que otra jam con la variante de en lugar de hacer un videojuego hacemos un modelo de ciencia de datos aplicado a un problema de la vida real.
En el caso del Datathon de Cajamar, los equipos participantes podían elegir entre dos retos: uno de Visualización de Datos patrocinado por IBM y otro de recomendación de productos bancarios patrocinado por Microsoft.  Aunque a mi me llamaba especialmente la atención el desafío de visualización de datos, mis colegas de equipo preferían realizar el de generar un modelo de recomendación, y como esto es una democracia pues ganan ellos y yo doy lo mejor de mí.
En este Datathon, solo podían participar estudiantes de los centros seleccionados. Y dentro de este centro solo se podían formar hasta 10 grupos para participar en la fase local, de todos ellos solo pasaría un grupo a la siguiente fase para terminar presentando los modelos delante del jurado. ¿Qué pasó con Outliers Canariones? Lo dimos todo, pero no sirvió de nada. En este tipo de competiciones ayuda mucho la experiencia previa en competiciones. La creatividad para mirar los datos de una manera distinta a la que nos vienen dados, experiencia laboral en el sector de la ciencia de datos e incluso máquinas potentes o acceso a recursos de altas prestaciones que te permitan llevar a cabo los cálculos de la manera más rápida posible son las claves del éxito.
Mi grupo en especial desarrollamos una serie de modelos, pero el mejor de todos ellos solamente consiguió predecir adecuadamente un 1% de los casos. Sí, lo sé, casi podemos decir que el modelo acierta esos valores casi por fortuna.
Aunque me dejó un sabor amargo en la boca, por este resultado, pero alimentó mi curiosidad por aprender métodos que no se dan en el máster o que aún no he visto como predicción en series temporales de datos.

Enlaces externos que te pueden interesar: