ESI UCLM

web uclm

繁體中文 ZH-TW English EN Français FR Deutsch DE Italiano IT Español ES Türkçe TR
HomeOpiniónExplicando el algoritmo

Explicando el algoritmo

Francisco Pascual Romero Chicharro

Explicando el algoritmo

Por Fco Pascual Romero (Coordinador del Máster U. en Ingeniería Informática)

Esta semana es noticia que ha habido, por desgracia, 26 muertos en las carreteras españolas. Esto mejora las previsiones del Big Data, o mejor dicho de los algoritmos de inteligencia artificial que hacen uso del Big Data, que eran de 36.  

De esta predicción surgen diversas cuestiones, en primer lugar, normalmente no se predice o pronóstica una cifra absoluta, los resultados de una predicción suelen ser algo más complejos, por ejemplo se ofrece un grado de confianza de la cifra  o en qué intervalo es más confiable esa cifra. Un único número es un buen dato para la audiencia pero no realmente útil.

Por otro lado, en muchas ocasiones el proceso de cálculo de la cifra es más valioso que la propia cifra. Es de suponer que para obtener ese “36” se han tomado en cuenta variables como la serie temporal, las circunstancias metereológicas, etc. El conocer los factores que influyen en la predicción es uno de los elementos más valiosos que existen para la ayuda a la toma de decisiones.

Por último está la propia distorsión de la predicción. Cuando tu predices algo sobre algún fenómeno ya afectas al mismo. Esto es algo que aprendí del profesor José Ángel Olivas hace más de 20 años y que aún sigue vigente. Por ejemplo, la DGT utiliza la cifra para condicionar nuestro comportamiento mediante una campaña publicitaria, intentando hacer que seamos más prudentes al volante. Esto es, el “big data” se utiliza para que el “big data” no acierte, dado que lo importante no es acertar sino reducir el número de muertos en carretera.

Otro ejemplo: Nadal en el Open de Australia.

Todo el mundo vio la imagen del 4% de probabilidad de victoria de Nadal ante Medveveed en la final del pasado Open de Australia. Los titulares posteriores se asemejaron a “Nadal vence al Big Data”, etc. Unas semanas después Marco Asensio marca un gol que según el modelo mostrado en televisión tenía un 10% de posibilidad de ser gol. Posteriormente, idénticos titulares, posiblemente lo que nos pasa es que cuando señalamos la luna miramos al dedo y no nos damos cuenta de lo que hay detrás de esos números.

Probabilidad vs Posibilidad. Un 4% de probabilidad indica que la victoria de Nadal era posible y más con el sistema de puntuación del tenis. No es un evento imposible, es raro, pero no es imposible. Detengamonos un momento, todos los 21 de diciembre pensamos que al día siguiente nos va a tocar el gordo de la lotería, y eso con una probabilidad de 0,001%, y siempre lo consideramos posible.

¿Cómo calcula el modelo esa cifra? En primer lugar se utiliza una probabilidad a priori en la cual Nadal tenía un 36% de probabilidad de ganar el partido. Normalmente estos modelos a priori están basados en los rankings (superior el de Medveded), rachas pasadas, superficie de juego, últimos partidos, etc. Luego está el devenir del partido; tomando un modelo sencillo que analizan las situaciones históricas similares, solo en 4 de 100 partidos a 5 sets se había remontado un resultado como el que había. Si nos centramos en Nadal, éste solo había remontado 2 partidos de 20 en esa situación. Por lo que el número está justificado, pero ¿nos da suficiente información?

¿Cómo se llega a esa cifra? Una cifra es un instante, y valorando un instante nos perdemos parte de la historia. Recordemos el principio de Incertidumbre de Heisenberg: si valoramos una variable de forma muy precisa estamos perdiendo la perspectiva de lo demás. Por otro lado, no es lo mismo llegar a ese 4% desde el 1% que haber bajado desde el 32%.  Y no solo eso, no hay que únicamente evaluar ese número si no como evolucionó posteriormente durante el partido, y como diferentes de eventos como salvar una bola de break o tener un break por encima en el tercer set puede cambiar mucho esa probabilidad de victoria. Esos eventos, el conocerlos y analizarlos son la clave en este análisis.

¿Cómo puedo cambiar esa probabilidad? Esto es la parte útil del número, si a un jugador le dices en un momento dado que tiene un 4% de probabilidad de victoria no le estás aportando nada nuevo, eso lo sabe mirando el marcador. Lo importante que hay que aportar es qué está pasando en su juego que le está llevando a la derrota y como puede cambiar esa dinámica. Es decir, lo útil sería decir: “mira Rafa, te está ganando todos los puntos que tiras con segundo saque, y no tienes ninguna doble falta, tenlo en cuenta” o “de los servicios que te tira al revés estás perdiendo el 90% y con rallies de menos de 3 bolas”. Esto es algo que si que le puede servir al jugador y al entrenador, esa es la verdadera utilidad de la aplicación de estos algoritmos y modelos.

En conclusión los números aislados son esos números, pero necesitan un contexto y un análisis pormenorizado, sobra toda interpretación “anumérica” de los mismos. Los algoritmos y los modelos pueden proporcionar mucha más información y conocimiento relevante que te permita entender los comportamientos y como obtener mejores resultados.

Comparte con:
Valora este artículo