José A. Martín Baos nuevo Doctor en Ingeniería Informática
El doctorando y profesor de la Escuela Superior de Informática, José Ángel Martín Baos, defendió su tesis doctoral titulada “Machine learning methods applied to transport demand modelling” el viernes 7 de julio, tesis que ha sido dirigida por los profesores Ricardo García Ródenas y Luis Rodríguez Benítez. El tribunal estuvo presidido por el profesor Emilio Carrizosa Priego de la Universidad de Sevilla, y completado por la profesora Carmen Lacave Rodero de UCLM y el profesor Tim Hillel de University College London. Felicitamos así a José Ángel por su gran logro y a sus directores por el magnífico trabajo realizado. José Ángel pasa a formar parte así del cuerpo de doctores de la ESI que suponen más del 85% de la plantilla. Este notable logro refuerza la reputación de la Escuela Superior de Informática como un centro de excelencia, reconocido con el sello de calidad europeo Euro-Inf, otorgado en reconocimiento a la calidad de sus programas académicos y el cuerpo de profesores y profesoras que los imparten.
Resumen
La modelización de la demanda de transporte juega un papel fundamen- tal en la planificación del transporte, permitiendo la estimación precisa de la demanda y la evaluación de políticas de transporte como el beneficio social de la creación de nuevas infraestructuras. Sin embargo, a medida que los sistemas de transporte se vuelven cada vez más complejos y los avances tecnológicos recientes permiten una mayor recolección de datos, los métodos analíticos tradicionales como los modelos de utilidad aleato- ria (RUM, por sus siglas en inglés) ya no son suficientes para manejar esta complejidad. Por lo tanto, es necesario incorporar nuevas técnicas que permitan resolver estas limitaciones. Para ello, esta tesis doctoral investiga el potencial de los métodos de aprendizaje automático (ML, por sus siglas en inglés) en este contexto.
En primer lugar, se analiza si los modelos de ML del estado del arte, como las redes neuronales artificiales, las máquinas de vectores de soporte y los métodos basados en ensamble de modelos (como los random forest o los gradient boosting decision trees), mejoran a los RUM en este campo de investigación. Para ello, se comparan estos modelos respecto a su capacidad predictiva y también en cuanto a la posibilidad de derivar indicadores econométricos, aplicados al contexto de la modelización de la demanda de transporte.
Los resultados obtenidos muestran que las técnicas clásicas son superadas por los modelos de ML desde el punto de vista de la calidad de las clasificaciones, sin embargo, estos últimos tienen dificultades para calcular indicadores econométricos confiables. Por ello, se propone un modelo de ML llamado Kernel Logistic Regression (KLR) como alternativa para modelar las funciones de utilidad de los RUM, lo que permite la derivación de indicadores econométricos. Los experimentos realizados demuestran que el KLR proporciona buenos resultados en conjuntos de datos utilizados en otras comparativas de la literatura, al tiempo que proporciona estimaciones insesgadas de los indicadores econométricos.
Además, se propone ampliar la aplicación del KLR a una gama de problemas de clasificación mediante una extensión de los modelos KLR llamada Generalized Kernel Logistic Regression (GKLR). Por ejemplo, la teoría del GKLR ha permitido la derivación de un modelo novedoso llamado Nested Kernel Logistic Regression (NKLR), que permite la aplicación del KLR a conjuntos de datos estructurados jerárquicamente.
Finalmente, esta tesis aborda una de las principales limitaciones del método KLR, que es la alta complejidad computacional y de almacenamiento cuando se aplica a problemas de gran escala. Para superar esta limitación, se sugiere el uso de métodos Nyström y de una novedosa propuesta para acelerar los métodos de entrenamiento de búsqueda lineal. Los resultados demuestran que al incorporar estas técnicas, el KLR puede abordar de manera eficiente problemas a gran escala que involucran cientos de miles de datos.