Post Image

Análisis Liga Mx Con Machine Learning

| Erick Muñozledo

Este proyecto surgió después de la venta del equipo Monarcas Morelia por ser el equipo de mi ciudad natal. Devastado por la noticia quise averiguar dónde rankeaba el equipo comparado con los demás. Si bien habrá gente que le baste decir que el campeón es el mejor equipo, yo quise adentrarme más para comparar a los equipos con diferentes aspectos y tener una imagen más completa que únicamente el campeonato.

En la realización de este proyecto y con la finalidad de hacer visuales los resultados, escogí utilizar el método estadístico de reducción de dimensionalidades PCA (Principal Component Analysis) ya que con este fui capaz de proyectar los 7 componentes en tan sólo 1 y 2 dimensiones por separado. De esta manera se enlistan los equipos segmentados por sus características en común y las que los hacen sobresalir. Una vez que se grafican cada equipo queda en una sola posición.

Los 8 componentes empleados junto con su peso son los siguientes:

Posición de tabla

Juegos ganados, empatados, perdidos

Goles a favor, en contra

Título

Además, generé un modelo de *clustering *(agrupación) con K-Means para clasificar a cada equpo en n (2-4) número de grupos de buenos a malos. Esto es para detectar en qué grupo queda cada equipo y saber a cúal pertenecen.

El modelo puede ser sensible a equipos que aparezcan en menor proporción a otros y es normal. No obstante sabe discriminar aquellos que aunque tengan poca participación destacan.

El modelo es muy interactivo gracias a que lo implementé en Streamlit, brindando la facilidad de añadir filtros para realizar los modelos con acotaciones del usuario. Estas son de tiempo, el torneo (apertura/clausura) e incluso la selección y exclusión de equipos. Con los filtros ajustados uno puede correr el modelo para generar un gráfico que dictamina el lugar del equipo con los parámetros proporcionados y los aspectos a evaluar.

Con fines de practicidad añadí 2 tablas, siendo la primera la de la base de datos usada de manera limpia para el usuario final y la segunda es una tabla pivote con la suma de los criterios de título para cada uno de los equipos seleccionados.

Ahora para probar el funcionamiento se muestra un ejemplo con los datos filtrados a los últimos 5 años (2015-2019):

Aquí se muestra un video de su funcionamiento para validar todo lo mencionado

Leer Más...

Macros de Excel

Macros Impresionantes en Excel que reducen el trabajo a un sólo click.