MINERÍA DE DATOS EN EL DEPORTE PROFESIONAL
Transcription
MINERÍA DE DATOS EN EL DEPORTE PROFESIONAL
INTELIGENCIA EN REDES DE COMUNICACIONES MINERÍA DE DATOS EN EL DEPORTE PROFESIONAL Jorge Carrasco Troitiño NIA 100029724 Grupo 91-5 Ingeniería Superior de Telecomunicación Minería de Datos en el deporte Inteligencia en Redes de Comunicaciones INTRODUCCIÓN: Las técnicas de minería de datos son aquellas que pretenden descubrir conocimiento oculto a partir de grandes volúmenes de datos. Hoy en día resulta un apoyo esencial en muchas organizaciones(empresas, clubes profesionales deportivos, universidades, gobiernos...) en el momento de tomar decisiones. La información hoy en día es un bien muy preciado, considerada como patrimonial por las organizaciones, por lo que su pérdida total o parcial ocasiona graves perjuicios. Por eso mismo es por lo que debe ser protegida, pero tambien debe ser explotada. De entre toda la información que se almancena podemos distinguir tres tipos desde el punto de vista cualitativo: la información que se almacena pero luego nunca se lee, la información que sí que se lee, orientada a consultas dirigidas, y por último aquella información que se guarda y posteriormente se analiza (este tipo el que proporciona en conjunto un verdadero conocimiento). Será necesario contar con herramientas y medios para explotar este tipo de información. Así, la minería de datos surge como una tecnología que trata de ayudar a comprender el vasto contenido de una base de datos. Los datos de por sí son una materia bruta y es cuando el usuario les da algún significado cuando se convierten en información, finalmente el conocimiento se obtendrá al analizar y relacionar dicha información. La minería de datos trabajará en busca de patrones, comportamientos, agrupaciones, secuencias, tendencias o asociaciones que puedan generar algún modelo que nos permita conocer mejor el dominio de datos para ayudar a una posible toma de decisión. En realidad, la minería de datos sería una etapa dentro de lo que se conoce como Extracción de Conocimiento en Bases de Datos (KDD), pero a nivel comercial se suele usar indistintamente un término u otro para referirse a lo mismo. Se trata básicamente de la identificación de un conocimiento a partir de unas bases de datos que aporten una ayuda de cara a la toma de decisiones. -1- Minería de Datos en el deporte Inteligencia en Redes de Comunicaciones APLICACIONES: Podemos decir que un proceso de Data Mining se compone de cuatro etapas principales: 1.- Determinación de los objetivos. 2.- Preprocesamiento de los datos: alrededor del 70% del tiempo total de un proyecto de minería de datos. 3.- Determinación del modelo: los datos se analizan estadísticamente, se visualizan y finalmente se utilizan algoritmos desarrollados en diferentes áreas de la Inteligencia Artificial. 4.- Análisis de los resultados: El cliente determina si le aportan algo. El ámbito de aplicación de la minería de datos es muy amplio, aquí vamos a hablar de su aportación al mundo de los deportes profesionales, pero podemos reseñar brevemente estas otras aplicaciones: - A nivel gubernamental: Por ejemplo el análisis que el FBI hace de las bases de datos comerciales para la detección de redes terroristas. - A nivel empresarial: Como por ejemplo los sistemas de detección de fraudes en las tarjetas de crédito, estudios de mercado, predicción de resultados comerciales... - A nivel académico: Estudios acerca de las actividades de un determinado sector del alumnado. - A nivel científico: Como por ejemplo el proyecto SKYCAT que se llevó a cabo para la toma y clasificación de imágenes del cielo. MINERÍA DE DATOS EN EL DEPORTE PROFESIONAL: Como hemos visto, la minería de datos se emplea allá donde haya una enorme cantidad de información de la que sacar conocimientos y conclusiones. El deporte profesional también cuenta con esta faceta. -2- Minería de Datos en el deporte Inteligencia en Redes de Comunicaciones En cualquier deporte, competición, equipo, hay que llevar cuenta de una cantidad considerable de datos y por supuesto, será de interés poder sacar conclusiones, información útil de toda esa cantidad de datos, así podríamos poner los siguientes ejemplos: - En una liga profesional puede interesar llevar cuenta de los jugadores que participan en ella, acompañando a cada jugador de información tal como el número de goles/puntos que lleva, el número de expulsiones/tarjetas que arrastra... para poder así sacar conclusiones o ayudar a la toma de decisiones por parte de los equipos de cara a la siguiente jornada o temporada. - De la misma forma, a nivel de equipo puede interesar llevar un control informatizado de los lesionados que tiene actualmente el equipo de manera que los entrenadores o los médicos puedan decidir al respecto. - Otro ejemplo podría ser el almacenamiento de todo tipo de características o estadísticas asociadas a cada jugador de una competición de manera que un entrenador pueda acceder a ellas y, a partir de los datos observados en sus rivales, aplicar la estrategia más adecuada para ganar el siguiente encuentro. Dos ejemplos concretos de la aplicación de técnicas de minería de datos en el mundo del deporte son los siguientes: AC Milán: El club italiano utiliza redes neuronales para prevenir lesiones y optimizar el acondicionamiento de cada atleta. Lo que puede ayudar a seleccionar el fichaje de un posible jugador o a alertar al médico del equipo de una posible lesión. El sistema es alimentado por datos de cada jugador, relacionados con su rendimiento, alimentación y respuesta a estímulos externos, que se obtienen y analizan cada quince días. El jugador lleva a cabo determinadas actividades que son monitoreadas por veinticuatro sensores conectados al cuerpo y que transmiten señales de radio que posteriormente son almacenadas en una base de datos. Actualmente el sistema dispone de 5.000 casos registrados que permiten predecir alguna posible lesión. Con ello, el club intenta ahorrar -3- Minería de Datos en el deporte Inteligencia en Redes de Comunicaciones dinero evitando comprar jugadores que presenten una alta probabilidad de lesión, lo que haría incluso renegociar su contrato. Por otra parte, el sistema pretende saber si una determinada lesión se relaciona con el estilo de juego de un país concreto donde se practica el fútbol. NBA: El Advanced Scout es un software que emplea técnicas de minería de datos que han desarrollado investigadores de IBM para detectar patrones estadísticos y eventos. Se trata de una herramienta orientada a un objetivo muy específico: analizar el juego de los equipos de la NBA, ayudar a los entrenadores a aislar eventos que no detectan cuando observan el juego en vivo o en película. El software utiliza todos los registros guardados de cada evento en cada juego: pases, encestes, rebotes y doble marcaje a un jugador por el equipo contrario, entre otros, pudiendo usarse en conjunto con las grabaciones de los partidos. Asimismo, Advanced Scout analiza los movimientos de los jugadores para ayudar a los entrenadores a preparar los partidos y las estrategias. Un resultado interesante fue el observado por los entrenadores de los Knicks de Nueva York. El doble marcaje a un jugador puede generalmente dar la oportunidad a otro jugador de encestar más fácilmente. Sin embargo, cuando los Bulls de Chicago jugaban contra los Knicks, se encontró que el porcentaje de encestes después de que al centro de los Knicks, Patrick Ewing, le hicieran doble marcaje era extremadamente bajo, indicando que los Knicks no reaccionaban correctamente a los dobles marcajes. Para saber el porqué, el cuerpo de entrenadores estudió cuidadosamente todas las películas de juegos contra Chicago. Observaron que los jugadores de Chicago rompían su doble marcaje muy rápido de tal forma que podían tapar al encestador libre de los Knicks antes de prepararse para efectuar su tiro. Con este conocimiento, los entrenadores crearon estrategias alternativas para tratar con el doble marcaje. Otro caso de aplicación efectiva de este software lo encontramos en el análisis jugada a jugada del partido disputado entre los New York Knicks y los Cleveland Cavaliers que reveló que cuando Mark Price jugaba en posición defensiva, John -4- Minería de Datos en el deporte Inteligencia en Redes de Comunicaciones Williams intentó cuatro tiros en salto y logró encestar los cuatro. El Advanced Scout no solo encontró esto sino que tambien explicó que esto era interesante porque difería considerablemente de la media de porcentaje de tiro del 49.3% que los Cavaliers tuvieron durante aquel partido. De esta manera si el entrenador quería encontrar el fallo acudiría directamente a ver los vídeos de estas situaciones en lugar de estar buscando el fallo durante horas de visualización de vídeos. IBM ofreció el Advanced Scout a la NBA, que se convirtió así en un patrocinador corporativo. La NBA dio a sus veintinueve equipos la oportunidad de aplicarlo y actualmente la mayoría de ellos lo están haciendo hasta el momento obteniendo descubrimientos interesantes. CONCLUSIONES: Dado que la capacidad de almacenamiento ha crecido en los últimos años de manera exponencial pero no así la capacidad de clasificación y procesado de datos, las tecnologías de minaría de datos se presentan como algo indispensable de cara a la gestión eficaz de bases de datos complejas. Las herramientas dedicadas a la minería de datos dependen de su aplicación concreta en muchas ocasiones, y este es el caso de los deportes profesionales, que con el objetivo de obtener información privilegiada para redireccionar la estrategia de un club en un ámbito determinado permite mejorar la gestión del equipo, optimizar su economía, mejorar el nivel y rendimiento deportivo del equipo, prevenir de lesiones en sus jugadores... Bibliografía: http://www.daedalus.es/AreasMD-E.php http://www.uoc.edu/web/esp/art/uoc/molina1102/molina1102.html http://www.anderson.ucla.edu/faculty/jason.frand/teacher/technologies/palace/dataminin g.htm -5-