UNIVERSIDAD COMPLUTENSE DE MADRID FACULTAD DE CIENCIAS MATEMÁTICAS TESIS DOCTORAL Aproximación Bayesiana aplicada al Reparto Modal en Modelos de Transporte MEMORIA PARA OPTAR AL GRADO DE DOCTOR PRESENTADA POR Óscar de Gregorio Vicente DIRECTORES Miguel Ángel Gómez Villegas Beatriz González Pérez © Óscar de Gregorio Vicente, 2021 UNIVERSIDAD COMPLUTENSE DE MADRID FACULTAD DE CIENCIAS MATEMÁTICAS TESIS DOCTORAL Aproximación Bayesiana aplicada al Reparto Modal en Modelos de Transporte MEMORIA PARA OPTAR AL GRADO DE DOCTOR PRESENTADA POR Óscar De Gregorio Vicente Directores Miguel Ángel Gómez Villegas (UCM) Beatriz González Pérez (UCM) Año 2020 Programa de Doctorado en Ingeniería Matemática, Estadística e Investigación Operativa por la Universidad Complutense de Madrid y la Universidad Politécnica de Madrid Aproximación Bayesiana aplicada al Reparto Modal en Modelos de Transporte Tesis Doctoral Óscar De Gregorio Vicente Directores Miguel Ángel Gómez Villegas (UCM) Beatriz González Pérez (UCM) Año 2020 DECLARACIÓN DE AUTORÍA Y ORIGINALIDAD DE LA TESIS PRESENTADA PARA OBTENER EL TÍTULO DE DOCTOR D. Óscar De Gregorio Vicente, estudiante en el Programa de Doctorado de Ingeniería Matemática, Estadística e Investigación Operativa (IMEIO), de la Facultad de Ciencias Matemáticas de la Universidad Complutense de Madrid, como autor de la tesis presentada para la obtención del título de Doctor y titulada: Aproximación Bayesiana aplicada al Reparto Modal en Modelos de Transporte y dirigida por: Miguel Ángel Gómez Villegas y Beatriz González Pérez DECLARO QUE: La tesis es una obra original que no infringe los derechos de propiedad intelectual ni los derechos de propiedad industrial u otros, de acuerdo con el ordenamiento jurídico vigente, en particular, la Ley de Propiedad Intelectual (R.D. legislativo 1/1996, de 12 de abril, por el que se aprueba el texto refundido de la Ley de Propiedad Intelectual, modificado por la Ley 2/2019, de 1 de marzo, regularizando, aclarando y armonizando las disposiciones legales vigentes sobre la materia), en particular, las disposiciones referidas al derecho de cita. Del mismo modo, asumo frente a la Universidad cualquier responsabilidad que pudiera derivarse de la autoría o falta de originalidad del contenido de la tesis presentada de conformidad con el ordenamiento jurídico vigente. En Madrid, a 25 de noviembre de 2020 Fdo.: Óscar De Gregorio Vicente Esta DECLARACIÓN DE AUTORÍA Y ORIGINALIDAD debe ser insertada en la primera página de la tesis presentada para la obtención del título de Doctor. A Marco -¿Soñaré? -Desde luego que soñarás. Todas las criaturas inteligentes sueñan, pero nadie sabe por qué. (Arthur C. Clarke, 2010, Odisea Dos) Universidad Complutense de Madrid y Universidad Politécnica de Madrid Aproximación Bayesiana aplicada al Reparto Modal en Modelos de Transporte Tesis presentada por Óscar De Gregorio Vicente para obtener el grado de Doctor dentro del Programa de Doctorado en Ingenieŕıa Matemática, Estad́ıstica e Investigación Operativa 2020 Directores: Miguel Ángel Gómez Villegas y Beatriz González Pérez Agradecimientos A mi mujer Teresa y a mis hijos Guillermo y Elisa, por su apoyo, ánimo, generosi- dad infinita y comprensión incondicional. Ha sido una larga aventura y ellos siempre han estado a mi lado. A mis padres, abuelos y resto de mi familia, por darme las oportunidades y los valores necesarios y adecuados durante toda mi vida. A mis tutores, el Dr. M. Ángel Gómez Villegas y la Dra. Beatriz González Pérez, por sus aportaciones y por su dedicación en la elaboración de este trabajo. Al Grupo de Investigación en Métodos Bayesianos del Departamento de Estad́ısti- ca e Investigación Operativa de la Universidad Complutense de Madrid, por sus ideas en cuanto a las diferentes aplicaciones y ĺıneas de investigación con Redes Bayesianas. Al Grupo Integrado de Ingenieŕıa -GII- de la Universidade da Coruña, en especial a Diego y Rosa, con quienes he compartido horas de trabajo, viajes y descubŕı el salar de Uyuni. Al resto de compañeros y amigos que de alguna forma han estado presentes durante estos años. Esta investigación ha sido parcialmente subvencionada por el Ministerio de Eco- nomı́a y Competitividad, España, grant TRA2015-65283-R y la Universidad Com- plutense de Madrid–Banco Santander, España, grant PR26/16-20261. La fuente de la figura de la portada es el trabajo de Salinas Roberto (2013). Recuperado del enlace https://slideplayer.es/slide/2763492/. 2 https://slideplayer.es/slide/2763492/ Resumen El trabajo presentado en esta Memoria está orientado a demostrar que la uti- lización de las Redes Bayesianas (RB), aplicadas al área de la planificación de los transportes representa una mejora innovadora comparándola con otras técnicas ha- bitualmente empleadas hasta la fecha como son los modelos Logit y las Redes Neu- ronales (RN). En concreto, su utilización en la etapa del reparto modal de modelos de deman- da de cuatro etapas (generación-atracción, distribución, reparto o elección modal y asignación), que es aquella correspondiente en la que se enfrenta la unidad de de- cisión dentro de un conjunto discreto de alternativas, tanto para pasajeros como mercanćıas. Las preguntas fundamentales que se responden a lo largo de esta memoria son: ¿cuáles son las contribuciones originales de este trabajo?, ¿cuál es su naturaleza?, ¿cuál es su alcance? y ¿cuáles son sus limitaciones?. Los resultados obtenidos en este trabajo no permiten una generalización, de mo- mento, para modelos de transporte de mercanćıas, sino que son espećıficos para este caso. Teniendo en cuenta, además, que la confidencialidad del uso de los mismos condiciona el detalle de las alternativas propuestas y por tanto, de los resultados mostrados. Al respecto, mencionar que en el caṕıtulo 4.4 Metodoloǵıa, se enumeran otros trabajos similares recientes sobre modelos de transporte como los de Sun et al. (2006), Correa et al. (2009), Tang et al. (2012), Daziano et al. (2013), Yannis Tyrinopoulos (2013) y Tai Yu Ma (2015), con resultados igualmente prometedores. Sin embargo, todos ellos se focalizan en ámbitos de estudio urbanos o metropolitanos y de veh́ıculo privado, por lo que difieren en cuanto a su uso hacia un modelo de transporte de mercanćıas, como el indicado en el caso de estudio que se presenta, el 3 Resumen 4 cual además es un caso real. Ésta es la principal contribución original de este trabajo, el uso de una RB en la etapa de reparto modal de un modelo clásico de cuatro etapas, aplicado a un modelo multimodal de mercanćıas de ámbito mundial. Los objetivos generales que se han perseguido con este trabajo son: a.1) mejorar el proceso de decisión de viajeros y operadores de carga, en los procesos de par- ticipación pública y declaración de preferencias, a partir del análisis detallado de la información de partida. La aplicación de las RB para la obtención de resultados de cada alternativa, en comparación con las otras técnicas, se demuestra en este caso que ofrece mejores ajustes en las variables principales de tiempo y coste por alternativa; a.2) optimizar los modelos de transporte utilizados en planificación; a.3) comprobar que la aplicación de las aproximaciones bayesianas en la etapa de repar- to modal supone obtener mejores resultados; a.4) promover las redes bayesianas en entornos complejos que ya son una realidad como son los Sistemas Inteligentes de Transporte (ITS), los Sistemas Cooperativos (V2V, V2I, V2I2V, I2I) de transporte e infraestructuras, y los veh́ıculos autónomos. Los objetivos espećıficos, por otro lado, se resumen en: b.1) conseguir mejores resultados con menor cantidad de información; b.2) disminuir los tiempos de proce- samiento para el reparto modal; b.3) mejorar el ajuste coste-beneficio derivado de las mejoras aportadas por las RB en los resultados, cara a optimizar los recursos económicos existentes y conseguir financiación para los proyectos de infraestructura y transporte. En este caso hay que mencionar que el detalle de los costes de cada alternativa de transporte presentada está sujeto a confidencialidad. Sin embargo, en enlace http://www.iirsa.org/proyectos/detalle_proyecto.aspx?h=1351 se muestra la ficha descriptiva del proyecto correspondiente al COSIPLAN (Consejo Suramericano de Infraestructura y Planeamiento) de UNASUR (Unión de Naciones Suramericanas). Comprobándose que es uno de los proyectos más importantes del IIRSA (Iniciativa para la Integración de la Infraestructura Regional Suramericana) con una inversión total de unos 7.000 millones de dólares; b.4) mejorar los resultados respecto a los algoritmos utilizados habitualmente. El caso de estudio presentado está basado en el proyecto de un corredor ferroviario en Sudamérica, en el que partiendo del modelo de transporte asociado se obtienen http://www.iirsa.org/proyectos/detalle_proyecto.aspx?h=1351 Resumen 5 resultados comparativos de los errores correspondientes a la elección de las posibles alternativas de transporte de mercanćıas, aplicando los tres métodos indicados: un Multi Nomial Logit (MNL), una Red Neuronal y una Red Bayesiana. Los resultados obtenidos permiten concluir que la aproximación bayesiana con- sigue los mejores ajustes de las tres técnicas, minimizando los errores en la elección del modelo de reparto modal, por lo que se demuestra la hipótesis de partida. En cuanto a las futuras ĺıneas de investigación: mejora de los modelos macroscópi- cos de 4 etapas en las otras etapas en fase de estudio, fundamentalmente la etapa 1-Generación-Atracción y la etapa 2-Distribución; mejora de los algoritmos de segui- miento vehicular en los modelos microscópicos e h́ıbridos de simulación de tráfico, partiendo de datos obtenidos en tiempo real de los centros de control; optimización en las técnicas matemáticas empleadas en los modelos de eventos discretos, en re- lación al tratamiento de las longitudes máxima de cola y los servidores, mejorando los tiempos en los servicios; Sistemas Expertos aplicados al COVID19; mejora de las técnicas aplicadas en Digital Humanities en el procesamiento de la información obtenida de imágenes de alta resolución; Sistemas Inteligentes de Transporte (ITS) y Sistemas Cooperativos veh́ıculo-infraestructura; veh́ıculos de conducción autónoma, RPAS (drones) y sistemas robóticos; redes sociales, redes de telecomunicación, re- des de abastecimiento y distribución (electricidad, agua, gas. . . ) en cuanto al ajuste de los modelos de consumo y de demanda; modelos genéticos, modelos tumorales, innovación médica. Abstract The work showed in this Report is aimed at demonstrating that the use of Ba- yesian Networks (RB), applied to the area of transport planning, represents an in- novative improvement compared to other techniques commonly used to date such as Logit models and Neural Networks (RN). Specifically, its use in the stage of modal split of four-stage demand models (trip generation, distribution, modal split and assignment), which is the one in which the decision unit is faced within a discreet set of alternatives, both for passengers and freight. The key questions that are answered throughout this Report are: what are the original contributions of this work?, what is its nature?, what is its scope? and what are its limitations?. The results obtained in this work do not allow a generalization, for the moment, for freight transport models, but are specific for this case. Taking into account, in addition, that the confidentiality of their use conditions the detail of the proposed alternatives and, therefore, of the results shown. In this regard, it should be mentio- ned that in chapter 4.4 Methodology, other similar recent works on transport models such as those of Sun et al. (2006), Correa et al. (2009), Daziano et al. (2013), Yannis Tyrinopoulos (2013) and Tai Yu Ma (2015), with equally promising results. However, all of them are focused on urban or metropolitan areas of study and private vehicles, so they differ in terms of their use towards a freight transport model, such as that indicated in the case study presented, which it is also a real case. This is the main original contribution of this work, the use of a BR in the modal split stage of a classic four-stage model, applied to a world-wide multimodal freight model. 6 Abstract 7 The general objectives that have been pursued with this work are: a.1) impro- ving the decision-making process of travelers and cargo operators, in the processes of public participation and declaration of preferences, based on the detailed analysis of the initial information. The application of BN to obtain results for each alterna- tive, in comparison with the other techniques, is shown in this case to offer better adjustments in the main variables of time and cost per alternative; a.2) optimize transport models used in planning; a.3) checking that the application of Bayesian approximations in the modal split stage provides better results; a.4) promoting Ba- yesian networks in complex environments that are already a reality such as Intelli- gent Transportation Systems (ITS), Cooperative Systems (V2V, V2I, V2I2V, I2I) of transport and infrastructures, and autonomous vehicles. The specific objectives, on the other hand, are summarized as follows: b.1) achie- ving better results with less information; b.2) decreasing processing times for modal split; b.3c) improving the cost-benefit adjustment derived from the improvements contributed by the BRs in the results, in order to optimize existing economic re- sources and obtain financing for infrastructure and transport projects. In this case, it should be mentioned that the detail of the costs of each transport alternative presented is subject to confidentiality. However, the following official link shows the descriptive file of the project corresponding to the COSIPLAN (South American Council for Infrastructure and Planning) of UNASUR (Union of South American Na- tions): http://www.iirsa.org/proyectos/detalle_proyecto.aspx?h=1351. Pro- ving that it is one of the most important projects of the IIRSA (Initiative for the Integration of Regional Infrastructure in South America) with a total investment of about 7,000 million USD; b.4) improving the results regarding commonly used algorithms. A case study based on the project of a railway corridor in South America is pre- sented, in which, starting from the associated transport model, comparative results of the errors corresponding to the choice of possible merchandise transport alter- natives are obtained, applying the three methods indicated: a Multi Nomial Logit (MNL), a Neural Network and a Bayesian Network. The results obtained lead to the conclusion that the Bayesian approach provides the best adjustments of the three techniques, minimizing the errors obtained in the http://www.iirsa.org/proyectos/detalle_proyecto.aspx?h=1351 Abstract 8 choice of the modal split model, thus proving the starting hypothesis. Regarding future lines of research: improvement of the 4-stage macroscopic mo- dels in the other stages under study, fundamentally stage 1-Generation-Attraction and stage 2-Distribution; improvement of vehicle tracking algorithms in microsco- pic and hybrid traffic simulation models, based on data obtained in real time from control centers; optimization of the mathematical techniques used in the discrete event models, in relation to the treatment of maximum queue lengths and servers, improving service times; Expert Systems applied to COVID19; improvement of the techniques applied in Digital Humanities in the processing of information obtained from high resolution images; Intelligent Transportation Systems (ITS) and Vehicle- Infrastructure Cooperative Systems; autonomous driving vehicles, RPAS (drones) and robotic systems; social networks, telecommunication networks, supply and dis- tribution networks (electricity, water, gas. . . ) in terms of adjusting consumption and demand models; genetic models, tumor models, medical innovation. Prólogo El presente trabajo nace a partir de la idea de que los avances en los últimos diez años en el sector de la movilidad y el transporte, tanto en entornos urbanos como en entornos regionales o mundiales, requieren innovar y aplicar nuevas soluciones a los modelos de transporte utilizados hasta la fecha, tanto para pasajeros como para mercanćıas. Hay que pensar, por un lado, que los Sistemas Inteligentes de Transporte (ITS) y las herramientas de modelización están llevando un avance paralelo en soluciones innovadoras que, en algún momento, les hará converger de forma integral. Por ahora, esa integración se está realizando a nivel modular con algunas apli- caciones de ITS, que se están viendo reflejadas en la calidad de los modelos de transporte urbanos, ya que, muchos de los datos de entrada de estos mismos llegan en tiempo real a través de sensores o cámaras. Este avance, está permitiendo poco a poco, disponer de herramientas de planifi- cación de transporte que son de dos tipos: interactivas, con los objetos con los que se relacionan; iterativas, a nivel de las soluciones alcanzadas. Por otro lado, la Planificación de los Transportes de una determinada zona ne- cesita herramientas que permitan representar o modelizar, de forma anaĺıtica, la situación actual y futura de su red de infraestructuras. Una de estas herramientas son los denominados Modelos de Transporte que son representaciones virtuales de una red f́ısica, formada por arcos y nodos que poseen unas determinadas caracteŕısticas, en la que participan diferentes modos de trans- porte. Los objetivos principales de estos modelos son: investigar el comportamiento ac- tual de pasajeros y mercanćıas; predecir ese comportamiento a futuro, bajo dife- 9 Prólogo 10 rentes hipótesis que configuran diferentes escenarios; y aplicar los resultados como fundamento para la identificación y evaluación de problemas y la planificación de actuaciones. De esta manera, no sólo se pueden estimar demandas futuras para cada uno de los escenarios considerados, si no que derivados de estos resultados se pueden calcular las inversiones necesarias en transporte (material rodante o unidades), infraestructuras (red de carreteras, puertos, aeropuertos, ferrocarriles, hidrov́ıas, corredores maŕıti- mos, etc.), servicios, desarrollos urbańısticos, poĺıticas sociales, poĺıticas tarifarias, etc. . . Aśı como los costes e ingresos, directos e indirectos, lo que permite obtener las rentabilidades o beneficios globales de las actuaciones consideradas, marcando una matriz de jerarqúıas a nivel estructural, que permita ayudar en la toma de decisiones de alto nivel. Parte de los resultados incluidos en esta Memoria ya han sido publicados en un art́ıculo sujeto a J.C.R. de De Gregorio-Vicente, Ó (septiembre 2017). Existen dos tipos principales de Modelos de Transporte: los basados en viajes, siendo la unidad un viaje entre un origen y un destino; los basados en actividades, donde se analiza la cadena de viajes en un d́ıa completo, derivada de realizar una serie de actividades. A los primeros se les denomina modelos clásicos de cuatros etapas (four-step algorithm), mientras que a los segundos se les denomina (tour-based model). Si bien las máquinas de procesamiento actuales son capaces de trabajar con ambos, a nivel algoŕıtmico, el principal problema reside en la calibración de los segundos, ya que requiere de mucha información para cada una de las etapas consideradas, lo cual supone un diferencial económico a considerar (por tiempo y personal) respecto de los primeros. Por tanto, el presente trabajo se centra en la utilización de los modelos clásicos, cuyas cuatro etapas, en cuanto a los viajes modelizados en la red, son: Generación-Atracción (G/A); Distribución (D); Reparto Modal (RM); y Asignación a la red (A). Los niveles de estudio o detalle de estos modelos, a su vez, se pueden definir en: macroscópico, mesoscópico y microscópico. Pudiendo darse la situación de que de- terminados softwares permiten la visualización simultánea de un nivel macroscópico y un nivel microscópico, en lo que se denominan modelos h́ıbridos de representación. Prólogo 11 Dicho esto, actualmente nos encontramos con tres factores fundamentales que nos han de replantear la forma de abordar o construir los modelos de transporte: la unidad de decisión (viajero o cargador) no es Ideal y objetiva, sino que es Real y sub- jetiva, y parte de información previa para la toma de decisiones; los Sistemas Coope- rativos, basados en las comunicaciones e intercambio de información: entre veh́ıculos (V2V), entre veh́ıculo e infraestructura (V2I), entre veh́ıculo-infraestructura-veh́ıcu- lo (V2I2V) y dentro de la misma infraestructura (I2I), son ya un hecho; los veh́ıculos de conducción autónoma se impondrán en el corto-medio plazo, lo que afectará de lleno a la planificación de los transportes e infraestructuras. Aunque recoger todas las citas es prácticamente imposible, debemos citar a Ri- cardo A. Daziano, Luis Miranda-Moreno & Shahram Heydari (2013), donde están contenidas las RB asociadas a la distribución multinomial; y también citar a Tai-Yu Ma (2015) donde pueden verse distribuciones más generales aplicadas a este tipo de redes La distribución de la presente Memoria es la siguiente: en la sección 1 se explican los conceptos fundamentales de la Teoŕıa de Grafos, Probabilidad e Independencia; en la sección 2 se presentan las Redes Bayesianas, en cuanto a sus antecedentes, definición, propiedades, tipoloǵıa, aplicaciones y el detalle de las Redes Bayesianas Gaussianas; la sección 3 explica los puntos fundamentales de los Modelos de Trans- porte, los fundamentos básicos, los modelos de cuatro etapas, y las consideraciones en cuanto a los modelos de elección o reparto modal; la sección 4 describe un caso de estudio acerca de un corredor ferroviario, principalmente, de mercanćıas, incluyendo la construcción y calibración de un MultiNomial Logit (MNL), una Red Neuronal (RN) y una Red Bayesiana (RB) ajustada al caso concreto; la sección 5 incluye las principales conclusiones obtenidas del trabajo; la sección 6 muestra las futuras ĺıneas de investigación; la sección 7 la bibliograf́ıa principal consultada, si bien la documen- tación global es más extensa; la sección 8 incluye los Anexos principales, formados por el conjunto de datos de partida (Data Set), aśı como las macros utilizadas en R para la construcción de las Redes empleadas. Índice general Agradecimientos 2 Resumen 3 Abstract 6 Prólogo 9 1. Conceptos fundamentales 20 1.1. Fundamentos de la Teoŕıa de Grafos . . . . . . . . . . . . . . . . . . . 20 1.1.1. Antecedentes históricos . . . . . . . . . . . . . . . . . . . . . . 20 1.1.2. Conceptos básicos de Grafos . . . . . . . . . . . . . . . . . . . 22 1.1.3. Tipos de Grafos . . . . . . . . . . . . . . . . . . . . . . . . . 24 1.1.4. Grafos dirigidos . . . . . . . . . . . . . . . . . . . . . . . . . 26 1.1.5. Otras estructuras gráficas . . . . . . . . . . . . . . . . . . . . 28 1.2. Probabilidad e independencia . . . . . . . . . . . . . . . . . . . . . . 30 1.2.1. Probabilidad condicionada . . . . . . . . . . . . . . . . . . . 31 1.2.2. Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . 31 1.2.3. Independencia condicionada . . . . . . . . . . . . . . . . . . . 32 1.2.4. Independencia condicionada en variables aleatorias . . . . . . 33 1.2.5. Propiedades de la independencia condicionada en variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 1.2.6. D-separación y evidencia . . . . . . . . . . . . . . . . . . . . 34 12 Índice general 13 2. Redes Bayesianas (RB) 37 2.1. Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.2. Definición y propiedades . . . . . . . . . . . . . . . . . . . . . . . . . 38 2.3. Tipoloǵıa y aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . 42 2.3.1. Redes bayesianas discretas (RBD) . . . . . . . . . . . . . . . . 42 2.3.2. Redes bayesianas gaussianas (RBG) . . . . . . . . . . . . . . . 43 2.3.3. Redes bayesianas mixtas (RBM) . . . . . . . . . . . . . . . . . 47 2.3.4. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 2.4. Redes Bayesianas Gaussianas (RBG) . . . . . . . . . . . . . . . . . . 49 2.4.1. Construcción de una RBG . . . . . . . . . . . . . . . . . . . . 50 2.4.2. Independencia e Independencia condicionada . . . . . . . . . 52 2.4.3. Propagación de la evidencia en RBG . . . . . . . . . . . . . . 53 2.4.4. Normalidad y No Normalidad . . . . . . . . . . . . . . . . . . 54 2.4.5. Test de Doornick-Hansen . . . . . . . . . . . . . . . . . . . . . 55 2.4.6. Distribución Nonparanormal . . . . . . . . . . . . . . . . . . . 57 3. Modelos de transporte 60 3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 3.2. Fundamentos previos . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 3.2.1. ¿Qué son y para qué se usan? . . . . . . . . . . . . . . . . . . 61 3.2.2. Objetivos principales . . . . . . . . . . . . . . . . . . . . . . . 61 3.2.3. Tipoloǵıa y niveles de detalle . . . . . . . . . . . . . . . . . . 63 3.3. Modelo clásico de cuatro etapas . . . . . . . . . . . . . . . . . . . . . 64 3.3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 3.3.2. Especificaciones del Modelo clásico de cuatro etapas . . . . . . 66 3.3.3. Etapa 1: Generación-Atracción de viajes. . . . . . . . . . . . . 70 3.3.4. Etapa 2: Distribución de viajes . . . . . . . . . . . . . . . . . 74 3.3.5. Etapa 3: Reparto o elección modal . . . . . . . . . . . . . . . 82 3.3.6. Etapa 4: Asignación a la red . . . . . . . . . . . . . . . . . . . 88 3.3.7. Métodos de asignación . . . . . . . . . . . . . . . . . . . . . . 90 3.4. Consideraciones de los modelos de elección modal . . . . . . . . . . . 92 3.4.1. Multinomial Logit (MNL) . . . . . . . . . . . . . . . . . . . . 96 3.4.2. Redes Neuronales (RN) . . . . . . . . . . . . . . . . . . . . . . 98 Índice general 14 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 103 4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 4.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 4.2.1. Objetivos generales . . . . . . . . . . . . . . . . . . . . . . . . 103 4.2.2. Objetivos espećıficos . . . . . . . . . . . . . . . . . . . . . . . 104 4.3. Marco de actuación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 4.4. Metodoloǵıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 4.5. Base de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 4.6. Alternativas de elección . . . . . . . . . . . . . . . . . . . . . . . . . 112 4.7. Ficheros principales de datos y estructura . . . . . . . . . . . . . . . 113 4.7.1. Archivo Excel Dataset Eleccion Modal . . . . . . . . . . . . . 118 4.7.2. Hoja Excel DATASET Elección Modal . . . . . . . . . . . . . 118 4.7.3. Archivo Excel RDataset . . . . . . . . . . . . . . . . . . . . . 119 4.7.4. Fichero de texto elecmod . . . . . . . . . . . . . . . . . . . . . 120 4.8. Propósitos del modelo de elección modal . . . . . . . . . . . . . . . . 120 4.9. Calibración del MNL . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 4.10. Calibración de la RN . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 4.11. Calibración de la RB . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 4.12. Ajuste en RStudio de RN y RB . . . . . . . . . . . . . . . . . . . . . 138 4.12.1. Ajuste de redes neuronales . . . . . . . . . . . . . . . . . . . . 138 4.12.2. Ajuste de redes bayesianas . . . . . . . . . . . . . . . . . . . . 141 4.13. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 5. Conclusiones 146 6. Futuras ĺıneas de investigación 159 7. Bibliograf́ıa 162 A. Muestra de la Base de Datos 170 B. DATASET ELECCION MODAL 171 C. RDATASET: DATASET 173 Índice general 15 D. RDATASET: DATANORM 175 E. MACRO: R Red Neuronal.R 177 F. MACRO: Trainnet.R 178 G. MACRO: R Red Bayesiana.R 179 Índice de figuras 1.1. Localización de Königsberg . . . . . . . . . . . . . . . . . . . . . . . . 21 1.2. Puentes de Königsberg . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.3. Grafo de los Puentes de Königsberg . . . . . . . . . . . . . . . . . . . 22 1.4. Representación gráfica de una red social. Fuente: INESEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 1.5. Representación gráfica de los ISP y nodos de Internet. Fuente: jurvetson @ Flickr. Licencia: CC BY 2.0 . . . . . . . . . . . . 24 1.6. Arista dirigida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 1.7. Arista no dirigida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 1.8. Grafo dirigido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 1.9. Grafo no dirigido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 1.10. Grafo mixto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 1.11. Grafo o árbol simple (izquierda) y poliárbol (derecha) . . . . . . . . . 27 1.12. Grafo ćıclico dirigido (DCG) (izquierda) y Grafo aćıclico dirigido (DAG) (derecha) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 1.13. Grafo moral Gm del grafo no dirigido de la Figura 1.9 . . . . . . . . . 29 2.1. De arriba a abajo: conexión serial, conexión convergente y conexión divergente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 2.2. Red con propiedad de Markov . . . . . . . . . . . . . . . . . . . . . . 42 2.3. Red Bayesiana Discreta . . . . . . . . . . . . . . . . . . . . . . . . . . 43 2.4. Red Bayesiana Gaussiana (desplazamientos vehiculares laterales con aceleración . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 16 Índice de figuras 17 3.1. Modelo macroscópico de Estados Unidos de América (Fuente: Caliper Corp.) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 3.2. Modelo macroscópico de Madrid (Fuente: Ayuntamiento de Madrid (Central de Movilidad)) . . . . . . . . . . . . . . . . . . . . . . . . . 62 3.3. Desagregación de las diferentes etapas de viaje a lo largo de un d́ıa (Fuente: “Travel Demand Modelling” (Moshe Ben Akiva) – Massa- chusetts Institute of Technology (MIT)) . . . . . . . . . . . . . . . . 63 3.4. Modelo clásico de las cuatro etapas (Ortúzar and Willumsen 2011) . . 65 3.5. Red multimodal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 3.6. Matriz de viajes. Fuente: Modelling Transport Manual (Ortúzar, J.D., y Willumsen, L. G. (2011)) . . . . . . . . . . . . . . . . . . . . . . . . 75 3.7. Modelo del perceptrón simple con una entrada fija (arriba). Red neu- ronal multicapa. Fuente: Ramı́rez, J.A. (abajo) . . . . . . . . . . . . . 100 4.1. Desconexión ferroviaria red oriental y red andina . . . . . . . . . . . 105 4.2. Propuesta de conexión con CFBC . . . . . . . . . . . . . . . . . . . . 105 4.3. Modelo de transportes (mundial) . . . . . . . . . . . . . . . . . . . . 107 4.4. Esquema relacional del modelo de transportes . . . . . . . . . . . . . 110 4.5. Hoja Excel DATASET Eleccion Modal . . . . . . . . . . . . . . . . . 114 4.6. Estructura DATA1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 4.7. DATANORM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 4.8. Fichero de texto elecmod . . . . . . . . . . . . . . . . . . . . . . . . . 117 4.9. Ejemplo de comparativa situación base (arriba) y situación futura (abajo) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 4.10. Ejemplo de muestra de datos de exportaciones e importaciones . . . . 129 4.11. Perceptron multicapa entrenada por el conjunto de datos . . . . . . . 130 4.12. Grafo de la Red Bayesiana . . . . . . . . . . . . . . . . . . . . . . . . 136 4.13. Interfaz RStudio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 4.14. Instalación libreŕıa neuralnet . . . . . . . . . . . . . . . . . . . . . . . 139 4.15. Error cuadrático medio por alternativa de transporte . . . . . . . . . 144 4.16. Error máximo absoluto por alternativa de transporte . . . . . . . . . 145 B.1. DATASET ELECCION MODAL . . . . . . . . . . . . . . . . . . . . 172 Índice de figuras 18 C.1. RDATASET: DATASET . . . . . . . . . . . . . . . . . . . . . . . . . 174 D.1. RDATASET: DATANORM . . . . . . . . . . . . . . . . . . . . . . . 176 Índice de cuadros 3.1. Variables de las rutas . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 4.1. Alternativas disponibles en el modelo (C=carretera, MM=multimodal carretera/tren). * Esta alternativa no está disponible en la actualidad, sino que será fruto de la construcción del CFBC. . . . . . . . . . . . . 113 4.2. Parámetros función de utilidad / p-valor del test de significación . . . 124 4.3. Resultados ajuste MNL . . . . . . . . . . . . . . . . . . . . . . . . . . 126 4.4. Variables de entrada de la RN . . . . . . . . . . . . . . . . . . . . . . 129 4.5. Resultados ajuste RN . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 4.6. Variables para la Red Bayesiana . . . . . . . . . . . . . . . . . . . . . 134 4.7. Resultados de la calibración de la RB . . . . . . . . . . . . . . . . . . 135 4.8. Resultados ajuste RB . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 4.9. Resultados comparativos ajuste MNL, RN y RB . . . . . . . . . . . . 143 19 Caṕıtulo 1 Conceptos fundamentales Este Caṕıtulo recoge conceptos fundamentales que permiten identificar la Teoŕıa de Grafos y Probabilidad, de la que derivan los modelos gráficos probabiĺısticos (o redes probabiĺısticas), a los que pertenecen las Redes Bayesianas (RB), las cuales se construyen a partir de aspectos cualitativos y cuantitativos. Muchos de esos concep- tos matemáticos fundamentales básicos y de las redes bayesianas mostrados en esta memoria han sido recogidos previamente en otras investigaciones anteriores, entre las que destacan como referentes cercanos las de Gómez-Villegas, M.A., Máın, P. y Susi, R. (2006) y Gómez-Villegas, M.A., Máın, P. y Viviani, P. (2014), por lo que deben ser ya conocidos para el lector. La Teoŕıa de Grafos, permite representar y explicar el aspecto cualitativo del modelo en cuanto a la estructura de dependencia (o independencia) de un conjunto de variables aleatorias, y la Probabilidad, a su vez, el aspecto cuantitativo definiendo numéricamente estas relaciones. 1.1. Fundamentos de la Teoŕıa de Grafos 1.1.1. Antecedentes históricos La ciudad de Königsberg (hoy Kaliningrado) ha pasado a la historia por ser el lugar donde se planteó el famoso problema de sus siete puentes, y cuya solución dio lugar a la Teoŕıa de Grafos. 20 Caṕıtulo 1. Conceptos fundamentales 21 Figura 1.1: Localización de Königsberg Figura 1.2: Puentes de Königsberg Para hacernos una idea, Königsberg fue la capital de Prusia Oriental desde la Baja Edad Media hasta 1945, cuando fue tomada por la actual Rusia y renombrada como Kaliningrado, capital del actual óblast de Kaliningrado. Fue fundada por la Orden Teutónica y tuvo gran relevancia estratégica como ciudad portuaria al situarse en la desembocadura del ŕıo Pregolia, que llega hasta la laguna del Vı́stula, comunicado a su vez con el mar Báltico por el estrecho de Baltisk. En dicha ciudad, en el siglo XVIII hab́ıa siete puentes (actualmente solo cinco) que cruzaban el ŕıo Pregolia y conectaban sus cuatro regiones (ver Figura 1.3), y los ciudadanos se preguntaban si con alguna ruta se podŕıan cruzar todos los puentes una y solo una vez para ahorrar tiempo en sus desplazamientos. Hay que hacerse una idea de que esto que para nosotros puede ser tan trivial, en aquella época no lo era Caṕıtulo 1. Conceptos fundamentales 22 Figura 1.3: Grafo de los Puentes de Königsberg tanto, habida cuenta de los precarios medios de transporte y v́ıas de comunicación existentes entonces. Leonard Euler (Basilea 1707, San Petesburgo 1783), halló la respuesta a esta pregunta y demostró que no era posible, modelizando la situación solo con aquello que era trascendente para el problema: las cuatro regiones (nodos) y los siete puen- tes (arcos) que las conectaban (ver Figura 1.3). La estrategia de resolución de este problema se considera la primera piedra de la Teoŕıa de Grafos y de la Topoloǵıa, al darse cuenta de que para que en un grafo de este tipo pueda recorrer cada arista, una y solo una vez, era necesario que a cada vértice llegara un número par de aristas, salvo a lo sumo dos vértices (inicial y final), y en este caso todos los vértices tendŕıan un grado impar, por lo que seŕıa imposible cruzar todos los puentes una y solo una vez. 1.1.2. Conceptos básicos de Grafos Un grafo representa gráficamente una colección de objetos V = {V1, ..., Vn} lla- mados vértices (o nodos) relacionados entre śı mediante una selección de segmentos (aristas) que unen pares de vértices, que pueden ser dirigidos o no dirigidos. T́ıpi- camente los vértices se representan mediante puntos y las aristas mediante ĺıneas. Siendo Eij la arista que une los elementos Vi y Vj pertenecientes a V, se define impĺıcitamente un grafo, donde V = {V1, ..., Vn} son los nodos y E el conjunto de aristas que lo forman. La importancia de los grafos reside en que son capaces de representar gráficamen- Caṕıtulo 1. Conceptos fundamentales 23 Figura 1.4: Representación gráfica de una red social.Fuente: INESEM te, y de forma simplificada, problemas que se plantean en la vida real, como hemos visto en el apartado anterior, que pueden resolverse mediante diferentes técnicas y herramientas matemáticas de tal forma que es factible encontrar soluciones óptimas de forma más eficiente. En la actualidad se pueden representar mediante grafos diferentes tipos de redes, entendiendo éstas como conexiones entre nodos mediante aristas, teniendo aśı redes de telecomunicación, redes de enerǵıa, redes de suministros, redes sociales, redes de transporte, etc. Por ese motivo, la teoŕıa de grafos y su capacidad de representa- ción, análisis y optimización de redes, mediante grafos, es una de las ramas de la matemática con mayor aplicabilidad y potencial a futuro, al utilizar combinatoria, álgebra, probabilidad, geometŕıa, aritmética, etc. En las Figuras 1.4 y 1.5 se muestran sendos grafos de una red social genérica, aśı como de los ISP (Internet service provider) y nodos de Internet. Ambas represen- taciones permiten modelizar de manera práctica las diferentes relaciones existentes en ambos casos, identificando los diferentes nodos o vértices y aristas en cada caso. Este tipo de representaciones es aplicable, como se ha indicado, a otro tipo de redes. Caṕıtulo 1. Conceptos fundamentales 24 Figura 1.5: Representación gráfica de los ISP y nodos de Internet. Fuente: jurvetson @ Flickr. Licencia: CC BY 2.0 Definición 1.1 Se define al Grafo G=(V,E) como el par donde V = {V 1, V 2, .., Vn} es un conjunto de elementos denominados vértices o nodos y E ⊆ V × V es un conjunto de aristas o arcos. Cada elemento de E, se representa por Eij , indicando que corresponde a la arista que une Vi con Vj , para i 6= j. 1.1.3. Tipos de Grafos Dependiendo de la relación y el orden que existe entre los nodos del grafo dife- renciamos dos tipos de aristas: aristas dirigidas y aristas no dirigidas: Aristas dirigidas, cuando Eij ∈ E pero Eji /∈ E y se denotan como Vi→ Vj , tal que Vi se conecta con Vj y no viceversa. Es decir, representa una relación causa-efecto. Aristas no dirigidas, se dan cuando Eij ∈ E y Eji ∈ E y se denotan como Vi–Vj , tal que ambos nodos Vi y Vj quedan conectados o relacionados de forma rećıproca, quedando asociados entre śı. En las Figuras 1.6 y 1.7 se representan ambos tipos de aristas. A su vez, dependiendo de la cuantificación y tipo de aristas diferenciamos tres tipos de grafos: Si un grafo tiene todas sus aristas del conjunto E dirigidas, entonces el grafo se define como grafo dirigido u orientado; Caṕıtulo 1. Conceptos fundamentales 25 Figura 1.6: Arista dirigida Figura 1.7: Arista no dirigida Si un grafo tiene todas sus aristas del conjunto E no dirigidas, el grafo se define como grafo no dirigido o no orientado; Si el grafo tiene aristas del conjunto E de forma que existen dirigidas y no diri- gidas, el grafo se define como grafo mixto o de cadena. En las Figuras 1.8, 1.9 y 1.10 se representan diferentes tipos de grafos. Dado un grafo dirigido u orientado y una arista {v1, v2}, siendo v1 el origen y v2 es el fin de la arista, entonces las aristas aśı caracterizadas se llaman flechas del grafo. Una arista de un grafo es un lazo si φ(A) = (v, v). En un grafo orientado una flecha es un lazo si no coinciden origen y fin. Camino entre nodos es una sucesión de nodos conectados por una arista, tal que si se busca un camino entre los nodos Vi y Vj se tiene la sucesión de nodos (Vk1 , ..., Vkr) donde Vi= Vk1 y Vj = Vkr, de forma que existe una arista entre los nodos Vkl y Vkl+1 ∀l = 1, ...,r. El camino es cerrado cuando el nodo inicial del camino Figura 1.8: Grafo dirigido Caṕıtulo 1. Conceptos fundamentales 26 Figura 1.9: Grafo no dirigido Figura 1.10: Grafo mixto coincide con el nodo final del mismo, es decir, si Vk1 = Vkr. Se denomina Ciclo al camino cerrado en un grafo dirigido D, y se denomina bucle al camino cerrado en un grafo no dirigido. Un grafo G es conexo, si para vértices v y w, tomados de dos en dos, existe una sucesión de lados l1,. . . , lk tal que v es adyacente a l1, w es adyacente a lk , y cada dos lados li , li+1 tienen un vértice adyacente en común. O dicho de otra forma, desde cualquier nodo inicial, existe al menos un camino que permite ir a todos los demás. Las Redes Bayesianas (RB) son un caso espećıfico de grafos dirigidos, y al ser éstas la base en la que se fundamenta la presente memoria, los análisis posteriores se centran únicamente en los grafos de esta tipoloǵıa. 1.1.4. Grafos dirigidos Las agrupaciones y relaciones entre los distintos nodos definen conjuntos de nodos concretos, como pasa también con los grafos no dirigidos, tal que, las relaciones fami- liares marcan algunas definiciones de igual carácter: familia, padre, hijo, ascendiente, descendiente,. . . De tal forma que: Caṕıtulo 1. Conceptos fundamentales 27 Figura 1.11: Grafo o árbol simple (izquierda) y poliárbol (derecha) Si Vi → Vj se dice que Vi es padre de Vj, y se denota como pa(Vj ), y Vj es hijo de Vi. El conjunto formado por la union de un nodo Vi y sus padres pa(Vi) se le llama familia del nodo Vi, de forma que fa(Vi) = Vi ∪ pa(Vi). El conjunto de todos los padres del nodo Vj se escribe como pa(Vj ). El número de padres de un nodo define tipoloǵıas de grafos dirigidos: si cada nodo tiene como máximo un padre, el grafo dirigido se denomina grafo o árbol simple; en caso contrario poliárbol Los ascendientes de un nodo Vi se denotan como as(Vi), y son el conjunto de nodos que tienen un camino hasta Vi; análogamente, son descendientes del nodo Vi, y se denotan de(Vi) el conjunto de nodos a los que se puede ir desde Vi. El conjunto de todos los nodos que no son ascendientes de Vi se denotan por na(Vi) = V \ (as(Vi) ∪ Vi). El conjunto de todos los nodos que no son descendientes de Vi se denotan nd(Vi) = V \ (de(Vi) ∪ Vi). A partir de estos conceptos de nodos ascendientes y descendientes en un grafo dirigido D = (V, E), surge identificar la ordenación entre dichos nodos. Asignando un número a cada nodo se obtiene una numeración ancestral, que es aquella tal que el número de cada nodo es menor que el correspondiente a sus hijos. Tomando de ejemplo el poliárbol de la Figura 1.11, los nodos {B,C,D} son des- cendientes del nodo A, siendo por su parte los nodos {A,B,E} los ascendentes del nodo D . Por otro lado, pa(D)={B,E}, y a su vez, fa(D) = {B,E,D}. A continuación, se muestran algunas de las principales definiciones asociadas: Definición 1.2 Un grafo dirigido D = (V, E) es aćıclico (DAG, Directed Acyclic Graphs) cuando no contiene ningún ciclo. Si contiene al menos un ciclo el grafo es un grafo ćıclico (DCG, Directed Cyclic Graphs). Caṕıtulo 1. Conceptos fundamentales 28 Figura 1.12: Grafo ćıclico dirigido (DCG) (izquierda) y Grafo aćıclico dirigido (DAG) (derecha) Las RB se describen por grafos aćıclicos dirigidos DAGs, que son grafos impres- cindibles para poder especificar problemas en los que exista cierto grado de incerti- dumbre y en el que un conjunto de variables estén relacionadas. Siempre que existe un DAG existe un grafo no dirigido asociado que es el propio DAG en el que las aristas dirigidas se reemplazas por aristas no dirigidas. Definición 1.3 Sea G = (V,E) un grafo dirigido, entonces G′ = (V′,E′) es subgrafo de G si verifica que V′⊆ V, E′⊆ E y G′ es un grafo, tal que es un subconjunto de nodos, con sus enlaces de G. Definición 1.4 Sea G = (V, E) un grafo dirigido, se denomina trayectoria de G a una sucesión de nodos V1,V2...Vp−1,Vp, tales que Ei i+1 ∈ E, para cada i = 1, 2, ..., p − 1. La longitud de la trayectoria es el número de arcos recorridos para unir el nodo V1 con el nodo Vp, siendo en ese caso de p − 1. 1.1.5. Otras estructuras gráficas Además de estas definiciones existen estructuras gráficas más simples que se pueden obtener transformando un grafo, pero guardando ciertas propiedades, con el objetivo de simplificar el uso de éste en ciertos procedimientos, de cara a poder tratar los elementos del grafo localmente eliminando o minimizando posibles obstáculos computacionales. Estas estructuras son interesantes desde el punto de vista de las RB. Definición 1.5 Sea G = (V, E) un DAG, asociado a un grafo dirigido o un grafo Caṕıtulo 1. Conceptos fundamentales 29 Figura 1.13: Grafo moral Gm del grafo no dirigido de la Figura 1.9 mixto, se denomina grafo moral Gm el obtenido uniendo con aristas no dirigidas a todos los nodos adyacentes no conectados con hijos comunes, y posteriormente, cambiando todos los enlaces dirigidos por conexiones no dirigidas. También se puede obtener un grafo moral Gm a partir de un grafo no dirigido G = (V, E), que puede venir asociado a un grafo dirigido o un grafo mixto. Definición 1.6 Sea G = (V, E) un DAG, asociado a un grafo dirigido o un grafo mixto, se denomina esqueleto de un grafo aquel que se obtiene sustituyendo la totalidad de los enlaces dirigidos por conexiones no dirigidas. Además de estas definiciones, es interesantes tener en cuenta otras denominacio- nes como son la de grafo triangulado y la de grafo descomponible, obtenidos a partir de transformaciones de un grafo no dirigido, en el que: a la arista que articula dos nodos de un bucle existente que no es de dicho bucle se le nombra cuerda del bucle; y cuando a cada bucle de longitud mayor o igual a cuatro se le añade al menos una cuerda, resulta un grafo triangulado. Definición 1.7 Sea G = (V, E) un grafo no dirigido, se denomina grafo triangu- lado aquel en el que todos los bucles de longitud mayor o igual que cuatro contienen una cuerda, como mı́nimo. Si se insertan cuerdas que dividen los bucles existentes en un grafo, entonces se puede triangular ese grafo. Esto es factible pero no es trivial, debido a que la estructura inicial del grafo debe permanecer invariante, por lo que la triangulación se realizará con el número mı́nimo de cuerdas, es decir, será una triangulación minimal. Y precisamente, una ĺınea de investigación existente se basa en la construcción de algoritmos que garanticen que una triangulación sea minimal. Definición 1.8 Sea G = (V, E) un grafo no dirigido, tal que los subconjuntos dis- Caṕıtulo 1. Conceptos fundamentales 30 juntos de nodos de V, no vaćıos (A, B, C), constituyen una descomposición de G si V = A ∪ B ∪ C, siendo C un subconjunto completo de V tal que cualquier camino de A a B, pasa por C. Definición 1.9 Sea G = (V, E) un grafo no dirigido, se le denomina grafo des- componible si: o es completo; o se obtiene una descomposición apropiada (A, B, C) siendo los subgrafos GA∪C y GB∪C grafos descomponibles. De las anteriores definiciones de descomposición y triangulación de G = (V, E), un grafo no dirigido, se obtiene el siguiente teorema obtenido de los resultados enunciados por Berge (1973) y Golumbic (1980): Teorema 1.1 Sea G = (V, E) un grafo no dirigido, son equivalentes las condiciones: G es un grafo triangulado; G es un grafo descomponible; cualquier separador mı́nimo existente entre dos vértices es completo. 1.2. Probabilidad e independencia Conocidos los principales fundamentos de la Teoŕıa de Grafos la cuestión es cómo poder relacionar un grafo con un conjunto de variables aleatorias, teniendo éstas su estructura de dependencia. La respuesta son las denominadas redes probabiĺısticas, o modelos gráficos probabiĺısticos, donde los nodos representan a las distintas variables y las aristas representan las relaciones de dependencia e independencia del conjunto de variables, tal que dichas relaciones de dependencia se dan con las distribuciones de probabilidad condicionadas. A partir de las propiedades del grafo, en cuanto a sus nodos y aristas, se conoce la distribución de probabilidad conjunta de las variables, y a partir de dichas ca- racteŕısticas es posible factorizar la distribución de probabilidad partiendo de otras funciones más sencillas, dadas para subconjuntos de variables. De esta forma es posible analizar las interdependencias de las variables. Las propiedades del grafo se denominan propiedades de Markov sobre grafos y consideran las diferentes tipoloǵıas de éstos De esta forma surgen los modelos gráficos probabiĺısticos, uniendo la Teoŕıa de Caṕıtulo 1. Conceptos fundamentales 31 Grafos y la Teoŕıa de la Probabilidad, lo que nos da una idea de las grandes capaci- dades matemáticas inherentes a ellos. 1.2.1. Probabilidad condicionada Partamos de la definición de probabilidad condicionada e independencia de su- cesos que se ven a continuación: Definición 1.10 Dados el espacio de probabilidad (Ω, ∆, P) y el suceso A∈∆ con P(A)>0, se llama probabilidad condicionada del suceso B ∈ ∆, dado el suceso A, al valor P(B|A) = P(A ⋂ B) P (A) Teorema 1.2 Sean (Ω, ∆, P) un espacio de probabilidad y A∈ ∆ tal que P(A)>0. Entonces, (Ω, ∆, PA) es un espacio de probabilidad, siendo PA(B)=P(B|A), B ∈ ∆ 1.2.2. Independencia En cuanto a la independencia de sucesos, se han de tener en cuenta las siguientes definiciones: Definición 1.11 Se dice que dos sucesos A, B ∈ A son independientes si y sólo si P (A ⋂ B) = P(A)P(B). Esta definición de independencia de los sucesos A y B también se cumple cuando P (A) = 0 y/o P (B) = 0. Además, si A y B son sucesos independientes, entonces A y Bc, Ac y B, aśı como Ac y Bc. Considerando la condicionalidad de sucesos, otra definición de independencia de sucesos es la siguiente: Definición 1.12 El suceso A es independiente de B si P(A| B) = P(A) Caṕıtulo 1. Conceptos fundamentales 32 Además, si A es independiente de B, también es cierto que B es independiente de A, es decir, se cumple la condición de simetŕıa, por lo que: P(B|A) = P(B) De igual forma, si A y B no son independientes (son dependientes), entonces: P(A|B) 6= P(A) ó P(B|A) 6= P(B) Aśı, considerando las definiciones de independencia anteriores, y aplicando la regla de multiplicación, resulta que si A es independiente de B entonces, P(A ⋂ B) = P(A|B) P(B) = P(A) P(B). 1.2.3. Independencia condicionada Sean A, B y C tres sucesos, entonces se dice que A es condicionalmente indepen- diente de B dado C, es decir, el suceso B no afecta al suceso A dado C si: P(A|B ⋂ C) = P(A|C) De forma similar a lo visto en el anterior apartado en relación a la propiedad de simetŕıa de la independencia de sucesos, la independencia condicionada también es simétrica, tal que, si A es condicionalmente independente de B dado C, entonces B es condicionalmente independente de A dado C: P(B|A ⋂ C) = P(B|C) Igualmente, aplicando la regla de la cadena, se tiene que si A es condicionalmente independente de B dado C, entonces: P(A ⋂ B|C) = P (A|C) P(B|C) En el caso de considerar C = Ω, espacio muestral, podemos asumir que la inde- pendencia es un caso particular de la independencia condicionada. Caṕıtulo 1. Conceptos fundamentales 33 1.2.4. Independencia condicionada en variables aleatorias Las siguientes definiciones se basan en la Teoŕıa de la Probabilidad y en los mo- delos gráficos probabiĺısticos en los que, como se indicó anteriormente, los nodos re- presentan variables aleatorias y las aristas representan las relaciones de dependencia e independencia del conjunto de variables, tal que dichas relaciones de dependencia se dan con las distribuciones de probabilidad condicionadas. Definición 1.13 Sean X e Y variables aleatorias; se dice que X e Y son variables aleatorias independientes, y se denota como X ⊥ Y , si y solo si P(X, Y) = P(X) P(Y) Esta igualdad es análoga a decir que su función de probabilidad conjunta es igual al producto de sus funciones de probabilidad marginales. De la misma forma, basándonos en la probabilidad condicionada podemos expre- sar la independencia de las variables X e Y, tal que P(X|Y) = P(X) Teorema 1.3 Si X ⊥ Y , entonces Y ⊥ X. Una vez vista la independencia de dos variables aleatorias dadas, X e Y, incluimos una tercera variable aleatoria, Z, para observar la independencia condicional entre ellas. Lo anteriormente indicado nos lleva al siguiente teorema que resume el concepto de independencia de dos variables aleatorias X e Y. Teorema 1.3 Si X ⊥ Y , entonces Y ⊥ X. Una vez vista la independencia de dos variables aleatorias dadas, X e Y, incluimos una tercera variable aleatoria, Z, para observar la independencia condicional entre ellas. Definición 1.14 Sean las variables aleatorias X, Y y Z, se dice que X e Y son condicionalmente independiente dado Z, y se denota como X ⊥ Y | Z, si y solo si P(X|Y, Z) = P(X|Z) Caṕıtulo 1. Conceptos fundamentales 34 Igualmente se cumple la independencia condicionada, X ⊥ Y | Z, si y solo si se cumple cualquiera de las siguientes condiciones: 1. P(X, Y|Z) = P(X|Z) P(Y|Z), con P(Z)>0 2. P(X, Y, Z) = P(X|Z) P(Y|Z) P(Z), con P(Z)>0 3. P(X, Y, Z) = P(X,Z)P(Y,Z) P (Z) , con P(Z)>0 1.2.5. Propiedades de la independencia condicionada en va- riables aleatorias A continuación, se indican las principales propiedades de independencia condi- cionada. Estas propiedades son relevantes para conseguir nuevas relaciones entre variables, lo cual es importante dependiendo de la información de cada una, ya que esto está relacionado directamente con la estructura del modelo gráfico probabiĺıstico en cuanto a sus nodos y aristas. Y eso es primordial no sólo para la construcción de los mismos, si no también para la interpretación derivada de las relaciones entre variables (o conjuntos de variables). 1. Conmutativa: si X ⊥ Y | Z ⇔ Y ⊥ X | Z. 2. Descomposición: si X ⊥ (Y ⋃ W ) | Z ⇒ X ⊥ Y | Z y X ⊥ W | Z. 3. Unión débil: si X ⊥ (Y ⋃ W ) | Z ⇒ X ⊥ Y | (W ⋃ Z) y X ⊥ W | (Y ⋃ Z). 4. Contracción: si X ⊥ Y | Z y X ⊥ W | (Y ⋃ Z) ⇒ X ⊥ (Y ⋃ W ) | Z. 5. Intersección: si X ⊥ Y | (Z ⋃ W ) y X ⊥ W | (Y ⋃ Z) ⇒ X ⊥ (Y ⋃ W ) | Z. 1.2.6. D-separación y evidencia Tanto el concepto de d-separación como el de evidencia son fundamentales para entender las Redes Bayesianas, y por ese motivo se incluyen en este apartado las definiciones más representativas de ambos. Caṕıtulo 1. Conceptos fundamentales 35 En primer lugar, se muestran dos definiciones fundamentales del concepto de d- separación gráfica de DAGs. La primera, de Pearl (1986) y la segunda, de Lauritzen, et al. (1990), siendo esta última la más utilizada. Definición 1.15 (d−separación, Pearl) Sean X, Y y Z tres conjuntos disjuntos de nodos del conjunto, D = (V, E ), siendo éste un DAG. Se dice que Z d−separa X e Y, y se denota como X ⊥D Y | Z, si y solo si, para cualquier camino no dirigido entre un nodo de X y un nodo de Y existe un nodo intermedio V tal que 1. Existe una conexion convergente con V, siendo éste el nodo al que convergen las aristas, tal que ni V ni los descendientes de V pertenecen a Z. 2. Bien la conexión es en serie y V es un nodo intermedio; bien la conexión es divergente siendo V el padre, y V pertenece a Z. Definición 1.16 (d−separación, (Lauritzen) Sean X, Y y Z tres conjuntos disjun- tos de nodos del conjunto, D = (V, E), siendo éste un DAG. Se dice que Z d−separa X e Y , y se denota como X ⊥ D Y | Z , si y solo si Z separa X e Y en el grafo moral del menor subconjunto ancestral que contenga a los nodos de X, Y y Z, dado por Dman(XUYUZ). En segundo lugar, dado un modelo gráfico probabiĺıstico como puede ser un DAG en el que, como hemos dicho anteriormente, los nodos representan variables aleatorias y los arcos la estructura de dependencia entre ellas, podemos intuir el concepto de evidencia al conocimiento del valor exacto que toma una de las variables aleatorias, ya que este valor condiciona la incertidumbre del resto de variables, y por tanto, a la información de la red completa. En función del conocimiento de los valores exactos de una o más variables, la información probabiĺıstica de la red completa se va actualizando, de tal manera que cada actualización puede suponer una mejora respecto al estado precedente. Al proceso de actualización de la probabilidad de la red a partir de la información de alguna de las variables del problema se le denomina propagación de la evidencia. La caracteŕıstica de propagación es importante en las Redes Bayesianas, como un tipo de modelos gráficos probabiĺısticos que son, considerando que éstas pueden incluir variables observables y no observables (continuas o discretas), aśı como los Caṕıtulo 1. Conceptos fundamentales 36 parámetros de los modelos de inferencia bayesiana, de tal forma que sea posible conformar distribuciones iniciales sobre las variables que no tienen padres en el DAG, aśı como distribuciones condicionadas de cada variable por sus padres, para el resto de variables. Este hecho es fundamental, como se verá en los siguientes caṕıtulos, al ser pieza clave en la demostración de que la aproximación bayesiana supone una mejora en los modelos de transporte. Caṕıtulo 2 Redes Bayesianas (RB) 2.1. Antecedentes Si bien los modelos usuales matemáticos tienen una larga trayectoria y una base sólida a la hora de encontrar soluciones al problema de la elección discreta, existen otro tipo de aproximaciones diferentes a las frecuentistas que pueden dar lugar a mejores resultados. Este es el caso de las aproximaciones bayesianas, que en este contexto concreto de los modelos de transporte se referirán como redes bayesianas. Las redes bayesianas surgen en la década de los 80, derivadas de las investigaciones que desde los 70 se veńıan haciendo en inteligencia artificial (IA) con los sistemas expertos, programas capaces de simular e incluso sustituir en algunas ocasiones a los razonamientos humanos. El término de redes bayesianas”se le atribuye en estos años, en concreto, en el año metricconverterProductID1985 a1985 a Judea Pearl1, (Pearl, J. 1985) para ha- cer hincapié en tres aspectos fundamentales: el carácter a menudo subjetivo de la información de entrada; la dependencia de acondicionamiento de Bayes como base 1 J. Pearl, informático y filósofo, conocido por desarrollar la aproximación probabiĺıstica a la IA, en particular utilizando las Redes Bayesianas, y la formalización del razonamiento causal en las ciencias emṕıricas. Desde 1970 trabaja en UCLA, donde actualmente es profesor en Ciencias de la Computación y Estad́ıstica y director del Laboratorio de Sistemas Cognitivos. Recientemen- te, en metricconverterProductID2011 ha2011 ha recibido el premio Turing por sus contribuciones fundamentales a la IA a través del desarrollo del cálculo de probabilidades y del razonamiento causal. 37 Caṕıtulo 2. Redes Bayesianas (RB) 38 para la actualización de la información; la distinción entre los modos causales y pro- batorios de razonamiento, lo que subraya Thomas Bayes en un documento publicado póstumamente en 1764 (Bayes, T.; Price, Mr. 1764). Pearl se basa en la utilización de la probabilidad subjetiva que ha sido introducida por Thomas Bayes en su célebre ensayo de 1964. Esto le permite a Pearl basarse en la fórmula de Bayes para introducir las “redes bayesianas”, como un procedimiento para actualizar la información. A finales de 1980 los textos seminales Razonamiento Probabiĺıstico en Sistemas Inteligentes (Pearl, J. 1988) y Razonamiento Probabiĺıstico en Sistemas Expertos (Neapolitan, Richard E. 1989) resumen las propiedades de las redes Bayesianas y ayudan a establecer a las mismas como un campo de estudio. Siguiendo esta ĺınea de investigación, durante la década de los 80 y 90, se puso de manifiesto que la IA no deb́ıa únicamente imitar el comportamiento racional humano, si no colaborar con éstos en las tomas de decisión a través de sinerǵıas. Es decir, transmitir conocimiento del proceso lógico seguido para resolver un problema y obtener una solución. Al respecto, en el año 1993, Clancey dirige una cita a los autores de la revista Knowledge Acquisition, quienes deciden publicarla, en la que indica: “La cuestión clave no es la IA, sino cómo mejorar la inteligencia natural con la ayuda de los sistemas basados en conocimiento.”2 2.2. Definición y propiedades Dicho esto como antecedente contextual, para explicar la importancia que en las últimas décadas están teniendo las RB, expliquemos que una RB es un modelo gráfico probabiĺıstico, un grafo aćıclico dirigido (DAG) que representa: 1. cualitativamente, un conjunto de variables aleatorias (nodos3) y sus interde- pendencias condicionales probabiĺısticas (codificado en sus arcos) y; 2 “The key issue is not artificial intelligence, but how to extend natural intelligence through knowledge based systems.” 3 Los nodos pueden representar cualquier variable: un parámetro medido, una variable latente o una hipótesis. Caṕıtulo 2. Redes Bayesianas (RB) 39 2. cuantitativamente, las distribuciones de probabilidad condicionadas de cada nodo dado sus padres. Por tanto, tal y como se ha indicado anteriormente, las variables aleatorias pueden ser discretas o absolutamente continuas, por lo que las distribuciones de probabilidad asociadas serán funciones de masa y funciones de densidad respectivamente. Para la especificación de la información cualitativa de la Red Bayesiana, se utiliza un DAG, que denotamos D = (V,E), donde cada uno de los nodos de D representa las variables del problema X = {X1,. . . ,Xn}, siendo por tanto V = {X1,. . . ,Xn}; y las aristas dirigidas que están en E muestran las relaciones de tipo causal, siendo él o los nodos padre, la causa, y él o los nodos hijos, el efecto. Además, la especificación de la información cuantitativa viene dada por un con- junto de distribuciones de probabilidad condicionada P = {p(x1|pa(X1)),..., p(xn|pa(Xn))}, de forma que para cada variable Xi X se tendrá la distribución de probabilidad condicionada de Xi dada la ocurrencia de sus padres pa(Xi) en el grafo D, denotada por p(xi|pa(Xi)). En resumen, formalmente, uniendo los dos conceptos, una RB está formada por el par (G,P), donde G es un DAG formado por un nodo para cada variable aleatoria de X = {X1, ...,Xn} y arcos que representan la estructura de dependencia probabiĺıstica entre ellas, P ={p(x1|pa(x1)), ..., p(xn|pa(xn))} es un conjunto de n distribuciones de probabilidad condicionadas, y pa(xi) es el conjunto de padres del nodo Xi en G. Es decir, un DAG es una RB respecto a un conjunto de variables, si el conjun- to de la distribución de probabilidad de las variables nodo puede ser escrito como el producto de la distribución local de cada nodo y sus padres como la siguiente factorización cuya demostración puede verse en Jensen (2001): P (X1, . . . , Xn) = n∏ i=1 P (Xi | padres(Xi)) (1) Si hay un arco del nodo A a otro nodo B, A es llamado padre de B y B es un hijo de A. El conjunto de nodos padre de un nodo xi se denota como padres (xi). Caṕıtulo 2. Redes Bayesianas (RB) 40 En esta última ecuación anterior se tiene una distribución de probabilidad con- dicionada por cada variable aleatoria. O lo que es lo mismo, cada nodo Xi es una variable condicionada por sus padres, lo que establece una relación directa entre la parte cualitativa y la parte cuantitativa de la red, ya que es el DAG el que permite determinar las distribuciones de probabilidad condicionadas que se consideren en la factorización de la distribución de probabilidad conjunta. Es decir, a un DAG le corresponde una factorización de la distribución de probabilidad conjunta de una RB. A partir de esta propiedad, existen algoritmos eficientes que realizan inferencia y aprendizaje en RBs como Neapolitan (2004), Castillo y otros (1997). Entre las principales caracteŕısticas de las RB se debe destacar que cumplen las propiedades de d-separación, que determinan estructuras de independencia (y de- pendencia) condicionada. Esto es, a partir del concepto de evidencia o valor exacto conocido que toma una de las variables (nodos), tal que al introducir esta informa- ción en la red, afecta a la incertidumbre del resto de las variables, se estudia cómo se traspasa la información de dicha evidencia a lo largo de una red, es decir, los criterios de separación que se cumplen en el grafo; las relaciones de independencia o dependencia condicionada entre las variables, que dependerán del tipo de conexión. Aśı se pueden considerar: 1. conexión serial: se transmite información de la evidencia, excepto que dicha información esté contenida en el nodo intermedio, (A y C d-separados dado B) 2. conexión divergente, la información fluye a través de la red, excepto si la evi- dencia se encuentra en el nodo padre, ya que queda bloqueada la comunicación entre los nodos hijos, (B y C d-separados dado A) 3. conexión convergente, la información puede ser transmitida a través de la red sólo si se tiene la evidencia sobre el nodo hijo, o un descendiente de éste, (A y B d-conectados dado C) Otra propiedad importante es la de Markov tal que si y sólo si, cada nodo Xi es condicionalmente independiente de sus no descendientes, nd(xi), dado sus padres, pa(xi) (Korb y Nicholson (2004)). Es decir, Caṕıtulo 2. Redes Bayesianas (RB) 41 Figura 2.1: De arriba a abajo: conexión serial, conexión convergente y conexión divergente P (Xi |pa (Xi) , nd (Xi)) = P (Xi|pa (Xi)) (2) En la Figura 2.2 se muestra un ejemplo de red con la propiedad de Markov: Esta propiedad, permite definir una RB de forma similar a la ecuación (1), y pueden demostar los siguientes teoremas: Teorema 2.1: Todo par (G,P) que cumple la propiedad de Markov, constituye una red Bayesiana. Teorema 2.2: Toda red Bayesiana formada por el par (G,P), cumple la propiedad de Markov. Conclusión, considerando rećıprocos estos dos teoremas, se puede concluir que toda RB definida por el par (G,P), cumple dos propiedades equivalentes: la factori- zación presentada en (1) y la de Markov presentada en (2). Caṕıtulo 2. Redes Bayesianas (RB) 42 Figura 2.2: Red con propiedad de Markov 2.3. Tipoloǵıa y aplicaciones Se debe señalar que existen distintos tipos de RB, dependiendo de la tipoloǵıa de la variable aleatoria X considerada en ella, discreta y/o continua, y que estas redes facilitan el desarrollo de distribuciones de probabilidad complicadas. En una RBD todas las variables aleatorias de X = {X1, ...,Xn} son discretas, lo que además implica que sus posibles estados son finitos; si además son binarias, respondiendo a los procesos de Bernoulli, la red se denota como Red Bayesiana Multinomial. 2.3.1. Redes bayesianas discretas (RBD) Dado que parte de la presente memoria se ha realizado durante la pandemia pro- ducida por el virus COVID19 (SARS-CoV-2), se incluye un ejemplo relacionado. En la siguiente imagen se muestra una RB Discreta, asociada a los eventos dicotómi- cos (SÍ=1, No=0) de tener: Ictus, COVID19 y śıntomas neurológicos, como cefalea, anosmia o dolores musculares, además de otros con afectación del sistema nervioso central y periférico cuya frecuencia y alcance están aún por determinar, según lo publicado en el segundo trimestre de 2020 por la Sociedad Española de Neuroloǵıa (SEN) en el “Manual Covid-19 para el neurólogo general”. 1. tener un Ictus está relacionado con tener śıntomas neurológicos Caṕıtulo 2. Redes Bayesianas (RB) 43 Figura 2.3: Red Bayesiana Discreta 2. tener COVID19 puede estar relacionado con tener un Ictus 3. tener COVID19 puede estar relacionado con tener śıntomas neurológicos De tal manera que se podŕıan configurar las tablas de probabilidad de la Figura 2.3 asociadas a esta RB y a partir de ella calcular la distribución de probabilidad conjunta como: P (C, S, I) = P (C)P (I|C)P (S|I, C) . 2.3.2. Redes bayesianas gaussianas (RBG) Estas redes incorporan variables de tipo continuas, donde se asume que las va- riables tienen distribución Normal y por tanto la relación entre ellas es lineal; una familia Potencial Exponencial Multivariante (MEP), distribución que ha sido am- pliamente desarrollada por este grupo de investigación de Métodos Bayesianos; y también puede usarse una aproximación de las densidades condicionadas usando distribuciones de sumas Gaussianas ponderadas. Caṕıtulo 2. Redes Bayesianas (RB) 44 Derivado de lo anterior, por tanto, en las RBG la distribución conjunta de las variables del problema X = {X1, ..., Xn} es normal multivariante N (µ, Σ), tal que la función de densidad conjunta es: f(x) = (2π)−n/2|Σ|−1/2exp [ −1 2 (x− µ)tΣ−1(x− µ) ] , siendo 1. vector de medias de dimensión n 2. Σ matriz de covarianzas, definida positiva de dimensión n × n 3. |Σ| determinante de la matriz de covarianzas 4. (x− µ)t el vector traspuesto de x− µ. Además, al ser una RB se cumple lo indicado en el apartado anterior en cuanto a su factorización: P (X1, . . . , Xn) = n∏ i=1 P (Xi | padres(Xi)) y aplicando las propiedades de la distribución Normal, tenemos: f (Xi | padres (Xi)) ∼ N µi + j−1∑ i=1 βji(xj − µj), νi  , siendo a) βji el coeficiente de regresión de Xj en la regresión de Xi condicionada a sus padres b) νi la varianza condicionada de Xi dado sus padres, tal que, νi = Σi−Σi pa(Xi)Σ −1 pa(Xi)Σ t i pa(Xi). c) ∑ i la varianza marginal de Xi Caṕıtulo 2. Redes Bayesianas (RB) 45 d) ∑ ipa(Xi) el vector de covarianzas entre Xi y las variables del conjunto padres (Xi) e) ∑ pa(Xi) la matriz de covarianzas del conjunto padres (Xi) Hay que tener en cuenta que el coeficiente de regresión βji indica la intensidad de la relación entre Xi y Xj . Esto significa que si βji = 0, tal que j < i, entonces Xj no es padre de Xi, y por tanto no existe una arista dirigida entre ellas. Históricamente dos de los ejemplos más empleados para las RBG han sido los de Enrique Castillo Ron, en cuanto a la aplicación de la Estad́ıstica (Castillo et al., 2003): 1) estudio del caudal de un ŕıo; 2) evaluación del nivel de daño de una viga de hormigón. Otro ejemplo más reciente sobre el estudio de la botánica es el incluido en Scu- tari, M. y Denis, J.B. (2015), en el que se analiza el crecimiento de una planta considerando: 1. Potencial del entorno, E ∼ N(50 102) 2. Potencial genético, G ∼ N(50 102) 3. Organismos vegetales, V |G,E ∼ N (-10.35534+0.5G+0.7711E,52) 4. Número de semillas, N |V ∼N(45+0.1V,9.9498742) 5. Peso medio de las semillas, W |V ∼N(15+0.7V,7.1414282) 6. Masa de grano cosechada, C|N ∼N(0.3N+0.3W,6.252) Si bien, un ejemplo más relacionado con el objeto de la presente memoria es el incluido en Weidl, G., Madsen, A. L., Wang, S., Kasper, D. y Karlsen, M. (2018), en el que se usan RBG Dinámica para entender el comportamiento de los patrones de tráfico y el reconocimiento temprano de las maniobras en las carreteras por parte de los veh́ıculos, analizando el comportamiento observado de los veh́ıculos y el espacio libre disponible en el carril objetivo al realizar desplazamientos laterales entre carri- les. Estos sistemas se utilizan en la conducción autónoma de veh́ıculos y es otra de las ĺıneas de investigación derivadas de esta investigación. Caṕıtulo 2. Redes Bayesianas (RB) 46 Figura 2.4: Red Bayesiana Gaussiana (desplazamientos vehiculares laterales con ace- leración Entre los intervalos de tiempo t -1 y t se asumen condicionales lineales gaussianos y se derivan de modelos f́ısicos, como: 1. O LAT REAL (t) (valor esperado del desplazamiento lateral) 2. V LAT REAL (t) (valor esperado de la velocidad lateral) 3. A LAT REAL (t) (valor esperado de aceleración lateral) Cuando O LAT REAL (t) es constante creciente y V LAT REAL (t) es alto o creciente (requiere un valor positivo A LAT REAL (t)), su combinación claramente indica que el veh́ıculo está saliendo de su carril. Y las variables V LAT REAL(t) y A LAT REAL(t) se definen tal que: 1. LAT REAL(t) con distribución N(OLATREAL(t− 1) + V LATREAL(t− 1)∆t, σ 2 O LAT (t)) Caṕıtulo 2. Redes Bayesianas (RB) 47 2. V LAT REAL(t) con distribución N(V LATREAL(t− 1) + ALATREAL(t− 1)∆t, σ 2 V LAT (t)) 3. A LAT REAL(t) ∼ N(ALATREAL(t− 1)∆t, σ 2 V LAT (t)) 2.3.3. Redes bayesianas mixtas (RBM) Las redes bayesianas mixtas o h́ıbridas contienten en el que el conjunto de varia- bles considerado X = (X1,X2, ...,Xn) variables de tipo continuo y discreto, tal que, las variables discretas tienen número finito de estados (exclusivos y excluyentes), pre- cediendo a las continuas en el grafo; y las variables continuas son Gaussianas, bien con distribución condicionada lineal Gaussiana de sus padres discretos, bien con la media de la distribución condicionada Gaussiana lineal del estado de sus padres con- tinuos. No es posible la existencia de padres continuos e hijos discretos. Información al respecto de este tipo de redes puede encontrarse en Cowell, et al. (1999). Calcular la distribución conjunta en este tipo de redes e inferir es más complejo, ya que la propagación de la evidencia se hace más complejo. Dicho esto, es interesante la utilización de mixturas de exponenciales truncadas (MTE) por parte de Moral et al. (2001), para representar la distribución de las va- riables de la red, discretas y continuas. De esta forma, las variables discretas pueden tener padres continuos en la red, lo que significa bajar el nivel de las restricciones anteriormente indicadas para las RBM habitualmente definidas. Información al res- pecto del proceso de inferencia y aprendizaje en RBM puede encontrarse en Cobb et al. (2007) En cuanto a la representación gráfica del DAG de una RBM, para distinguir entre variables discretas y continuas, se considera una doble circunferencia (o doble elipse) en las variables continuas. El conjunto de nodos V = {X1, ..., Xn} se particiona en variables discretas (Y) o variables continuas (Z), siendo V = Y∪Z, de tal manera que en un modelo condi- cionado Gaussiano, la distribución de una variable continua, tal que sus padres son discretos, será una distribución Gaussiana Multivariante: Caṕıtulo 2. Redes Bayesianas (RB) 48 Z | Y = y ∼ N (y, Σ(y)) con Σ definida positiva. Definición 2.1 Una variable aleatoria mixta X = (Y, Z) tiene distribucion con- dicionada Gaussiana si la función de de densidad conjunta es: f (x) = f (y, z) = χ(y)exp{g(y) + h(y)tz − zt K (y)z/ 2} tal que: 1. χ(y) ∈ {0, 1} representa si f es positiva en y 2. g, funcion real 3. h, vector 4. K, matriz 2.3.4. Aplicaciones En cuanto a las aplicaciones, de forma resumida, y por no retrotraernos demasiado atrás en el tiempo, los modelos gráficos probabiĺısticos se han usado para realizar técnicas de diagnóstico médico (Jensen, 2001), en sistemas expertos (Cowell, et al., 1999) y de planificación y control (Dean, et al., 1991; Chan, et al., 1992), además de sistemas dinámicos y de planificación de infraestructuras, como es este caso. En el caso concreto que nos ocupa de las RB en la modelización de transpor- te, caben destacar en los últimos años, por citar algunos, los siguientes trabajos realizados: - Aplicación de las redes bayesianas a la nueva movilidad mundial, como puede verse en Gómez-Villegas (2019), trabajo mostrado en el “XXXVIII Congreso Nacio- nal de Estad́ıstica e Investigación Operativa - SEIO 2019” en Alcoi. - Comparación de resultados en la elección modal del transporte de mercanćıas (De Gregorio- Vicente et al. (2017): “Aproximación Bayesiana aplicada al Reparto Modal en Modelos de Transporte de Mercanćıas. Caso Práctico: Corredor Ferroviario Bioceánico Central) Caṕıtulo 2. Redes Bayesianas (RB) 49 - Estimación de matrices origen-destino de viajes (matrices OD), a partir de la información de placas de matŕıculas en flujos vehiculares, o a partir de flujos parciales de tráfico dada una red urbana (Nogal Macho, M. (2011)), considerando ejemplos aplicados la red viaria de Nguyen-Dupuis, a la de Ciudad Real y a la del Estado de Vermont. Hay que indicar que dicho trabajo de Tesis Doctoral consiguió el primer Premio Internacional Abertis en el año 2012; - Análisis de decisiones en diferentes escenarios de transporte, que puede verse en Holland, A. (2003); - Construcción de modelos de predicción de flujos de tráfico en los arcos de una red dada, para estimar matrices OD, aśı como para encontrar la mejor ubicación para los puntos de conteo de tráfico con el objetivo de que las Administraciones (locales, regionales y nacionales) consigan una mejor gestión de la movilidad en términos globales, puede verse en Sánchez-Cambronero Garćıa-Moreno, S. (2008). Todos estos trabajos han puesto de manifiesto la potencia de las RB en este tipo de investigaciones asociadas a la modelización y planificación de redes de transporte, considerando una cantidad importante de variables, discretas y continuas. Si bien estos trabajos siempre han ido dirigidos hacia la estimación de flujos, marcando una ĺınea clara de investigación, la presente memoria se dirige más hacia la utilización de las RB en cuanto a la optimización de los resultados obtenidos en la etapa del reparto modal de los modelos clásicos de transporte de cuatro etapas, que se enumeran a continuación y cuyo detalle se expone en el siguiente caṕıtulo: prime- ra etapa, Generación-Atracción (o Consumo); segunda etapa, Distribución; tercera etapa, Reparto modal; y cuarta etapa, Asignación a red. 2.4. Redes Bayesianas Gaussianas (RBG) Vistos los aspectos fundamentales de las RB, definiciones, caracteŕısticas, tipo- loǵıas y aplicaciones, nos centraremos en los puntos clave de las RBG, al ser las más habitualmente utilizables, por las buenas propiedades derivadas de sus distribuciones Normales. Caṕıtulo 2. Redes Bayesianas (RB) 50 2.4.1. Construcción de una RBG Los pasos elementales que considero a la hora de construir una RBG se pueden considerar una mezcla entre la metodoloǵıa de 7 etapas propuesta por Bromley (2005) y las 3 etapas definida en otros trabajos similares (Estructura + Parámetros + Evidencia): 1. Identificar el marco de estudio y lo que se pretende resolver. 2. Conocer con qué inputs de entrada (variables y valores) fiables se puede contar. Esto es relevante ya que, dependiendo de la calidad de las variables, aśı será la calidad del modelo y de los resultados obtenidos. Esto lo resumen las meto- doloǵıas anglosajonas al respecto de la construcción de modelos al mencionar: “garbage in, garbage out”. 3. Conocer las relaciones de dependencia entre las variables para poder construir el grafo asociado al modelo de red, lo cual implica la parte cualitativa de la red. 4. Calcular las distribuciones de probabilidad de cada nodo del DAG en cuanto a sus parámetros, lo cual implica la parte cuantitativa del grafo, en cuanto a las funciones de densidad o condicionadas. 5. Analizar la propagación de la evidencia en los nodos de la red, una vez definida la parte cualitativa y cuantitativa, en cuanto a saber cómo cambian las distri- buciones de probabilidad a lo largo de la red cuando los valores de algunas de las variables son conocidos. La construcción del DAG, a partir de las variables y valores disponibles, ésta puede llevarse a cabo mediante un proceso: 1. Manual: grupo de trabajo formado por expertos en cada ámbito, bien a partir de las distribuciones condicionadas, bien a partir de la distribución conjunta; normalmente, para agilizar la construcción, primero se definen los parámetros de las distribuciones condicionadas y después la distribución conjunta, par- tiendo de la matriz de covarianzas Σ. A partir de los parámetros definidos en Caṕıtulo 2. Redes Bayesianas (RB) 51 las densidades condicionadas, se puede obtener dicha matriz Σ y por tanto, formularr la distribución conjunta de la RBG. 2. Automático: algoritmos de aprendizaje a partir de una base de datos dada, tal que se construya el DAG y las distribuciones de probabilidad. Construcción manual con las distribuciones condicionadas. Los paráme- tros requeridos se definen en base a las distribuciones condicionadas de la expresión anteriormente indicada: f (Xi | padres (Xi)) ∼ N µi + j−1∑ i=1 βji(xj − µj), νi  , siendo 1. µ: el vector de medias con dimensión n × 1, donde cada µi es la media de la variable Xi para i = 1, . . . , n. 2. los coeficientes de regresión βji de Xj en la regresión de Xi sobre pa(Xi), para i, j = 1, . . . , n. Estos dos conjuntos de parámetros son necesarios para determinar las medias condicionadas E(Xi | padres (Xi)). 3. las varianzas condicionadas νi de cada Xi dado sus padres, con i = 1, . . . , n. Construcción manual con la distribución conjunta. Se parte de los paráme- tros de la distribución conjunta del DAG: 1. µ: el vector de medias con dimensión n × 1, donde cada µi es la media de la variable Xi para i = 1, . . . , n. 2. Σ: la matriz (definida positiva) de covarianzas de dimensión n × n, donde σii es la varianza de Xi y σij es la covarianza entre Xi y Xj, para i, j = 1, . . . , n. Caṕıtulo 2. Redes Bayesianas (RB) 52 Construcción automática mediante algoritmos. Como se ha indicado ante- riormente, los algoritmos utilizados son capaces de construer el DAG y las distribu- ciones de probabilidad a partir de una base de datos inicial. La clave está en que dicha base contenga información suficiente y consistente para conseguir que los algoritmos funcionen de manera eficiente. Se distinguen diferentes tipos de algoritmos: 1. basados en medidas: utilizando búsquedas heuŕısticas se fija una medida posible a la RB a partir de la base de datos inicial, tal que se maximice esta medida. 2. basados en restricciones: el objetivo es formar un DAG que verifique las reglas de d-separación aplicando test de independiencia condicionada consistente con las propiedades de Markov. 3. Mixtos o h́ıbridos: combinan algoritmos basados en restricciones, que acoten el espacio de búsqueda; y algoritmos basados en medidas, tal que la medición del DAG sea máxima. El caso de estudio presentado en esta memoria precisamente utiliza el algoritmo mixto max − min hill − climbing (mmhc) de Tsamardinos et al. (2006) para calibrar el DAG de una RB construida con una base de datos incial, cuyos datos son oficiales y han sido depurados y validados previamente para garantizar la consistencia de la información. Las restricciones del algoritmo son max-min parents & children (mmpc), también de Tsamardinos et al. (2003), para conformar la estructura de la red; y las medidas hill−climbling (hc), de Russell and Norvig (2009), para concretar el sentido de los enlaces. 2.4.2. Independencia e Independencia condicionada Si bien son conocidos los siguientes resultados de la distribución Normal Mul- tivariante mostrados en este apartado, son igualmente importantes a la hora de relacionar la independencia condicionada con la matriz de covarianzas Σ. Las de- mostraciones de estas proposiciones se encuentran en Lauritzen (1996) o Anderson (2003), respectivamente, entre otros autores. Caṕıtulo 2. Redes Bayesianas (RB) 53 Proposicion 2.1 Sea X con distribucion Normal Multivariante N (µ, Σ) tal que X se particiona como X = {X1, X2} con µ y Σ dados por µ = (µ1, µ2) y Σ =  Σ11 Σ12 Σ21 Σ22  . Entonces, se cumple que: 1. X1 ∼ N (µ1, Σ11) y X2 ∼ N (µ2, Σ22) 2. X1 y X2 son independientes si y solo si Σ12 = Σ21 = 0 Teniendo en cuenta que la matriz Σ es definida positiva, entonces su inversa existe y la matriz de precisión se puede obtener como W = Σ−1. Entonces, llegamos a la siguiente proposición: Proposición 2.2 Sea X ∼ Normal Multivariante N (µ, Σ), si Σ es una matriz regu- lar e invertible, entonces las variables Xi y Xj son condicionalmente independientes dado el resto de las variables de X, si y sólo si, Wij = 0 (valor de la posición (i,j) de la matriz de precision K de la distribución es cero). 2.4.3. Propagación de la evidencia en RBG En apartados anteriores se ha explicado en qué consiste la propagación de la evidencia partiendo de la información conocida de una o algunas variables, y cómo se pueden actualizar las distribuciones de probabilidad del resto de las variables en base a esta información. Históricamente podemos identificar algoritmos de propagación desarrollados por nombrar a Normand, et al. (1992), Lauritzen (1992), Lauritzen, et al. (2001), Cowell (2005), si bien también hay que tener en cuenta el desarrollado por Castillo et al. (1997), que calcula recursivamente en cada iteración que se introduce información de la variable evidencial, la densidad condicionada de una distribución Normal, ac- tualizando aśı las probabilidades no evidenciales de la red, en tiempo lineal, dada la evidencia. Entonces, partiendo del conjunto de variables no evidenciales Y y de variables evidenciales E = {Xe}, entonces, X es una partición tal que X = (Y, E), tal que la Caṕıtulo 2. Redes Bayesianas (RB) 54 distribución condicionada de Y dado E = e es una distribución Normal Multivariante con parámetros: 1. µY |E=e= µY + ΣY E Σ−1 EE (e − µE) 2. ΣY |E=e= ΣY Y− ΣY EΣ−1 EEΣEY Por otro lado, partiendo de la densidad marginal a posteriori de una única variable respuesta, Xi ∈ Y, y una variable evidencial E, entonces, al realizar la propagación tenemos la siguiente ecuación cuyos parámetros son anteriores a la propagación de la evidencia: Xi | E= e ∼N(µ Y |E=e i , σ Y |E=e ii )= N(µi + σie σee (e− µe) , σii − σ2 ie σee ), siendo 1. µi y e las medias de Xi y Ei 2. σii y σee las varianzas de Xi y E 3. σie la covarianza entre Xi y E. Tal y como se ha indicado anteriormente, la propagación de la evidencia es un proceso recursivo tal que la variable evidencial se actualiza iteración a iteración. Por tanto, existe una relación lineal entre la cantidad de operaciones requeridas para actualizar la distribución de probabilidad de las variables de Y, y el número de variables de X. 2.4.4. Normalidad y No Normalidad Todo lo visto anteriormente es la base teórica que se considera imprescindible a la hora de afrontar un problema de redes. Sin embargo, la aplicación práctica de esta base no siempre es sencilla y para garantizar la fiabilidad y consistencia de los datos de partida es imprescindible validar los supuestos iniciales para poder construir una RBG con distribución de probabilidad conjunta, asociada a las variables de partida X = (X1, X2, ..., Xn), Normal Multivariante. Caṕıtulo 2. Redes Bayesianas (RB) 55 Para la validación del supuesto de Normalidad, el software R https://cran. r-project.org/ dispone de una libreŕıa llamada asbio en la que está implementada el test Omnibus de Doornick-Hansen (2008), que además es más potente que el test de Shapiro-Wilks. Este test es de gran ayuda desde varios puntos de vista, tomando de partida una base de datos con un número considerable de variables y registros: 1. si cada una de las variables, de forma independiente, no se ajusta a una distri- bución Normal Univariante, entonces la matriz no se ajusta a una distribución Normal Multivariante. 2. si todas las variables se ajustan a una distribución Normal Univariante, esto no implica el hecho de que la matriz total se ajuste a una distribución Normal Multivariante. 3. además, a nivel gráfico, revisar un gran número de variables aleatorias en cuan- to a su supuesto de distribución Normal resulta complejo, por solapamientos, por cambios de escala, etc. 2.4.5. Test de Doornick-Hansen La base teórica del estad́ıstico Doornick-Hansen es la siguiente: a) Caso univa- riante: toma de referencia el estad́ıstico de Bowman y Shenton (1975), basado en el cálculo de kurtosis, y asimetŕıa multivariante, que si bien son incorrelados, no cumplen con ser independientes, y además, la kurtosis de la muestra se acerca pau- sadamente a la condición de Normalidad. La solución para todo esto deriva de las investigaciones realizadas por Shenton y Bowman (1977), de tal forma que se esta- blece para la kurtosis una función de tipo gamma, tal que se cumpla que kurtosis > asimétrica + 1; b) Caso multivariante: se utiliza una transformación tal que aproxima una distribución multivariante a distribuciones Normales (estándar) independientes. Una vez hecho, posteriormente de forma univariante se obtienen kurtosis y simetŕıa. Aśı, el test resultante obtiene vectores de kurtosis y simetŕıa, en lugar de valores únicos. El test se define tal que: https://cran.r-project.org/ https://cran.r-project.org/ Caṕıtulo 2. Redes Bayesianas (RB) 56 DH = Zt1 Z1 + Zt2 Z2 Donde las variables Z1 and Z2 son aproximaciones Normal transformadas consi- derando la asimetŕıa (S) y la kurtosis (K) de la muestra. La asimetŕıa univariante (S), se transforma en una variable z 1 aproximadamente Normal, tal y como se indica en DÁgostino (1970): z 1 = δ ln (y + √ 1 + y2), con: β = 3 (n2 + 27n− 70) (n+ 1) (n+ 3) (n− 2) (n+ 5) (n+ 7) (n+ 9) w2 = −1 + √ 2(β − 1) δ = ( ln √ w2 )1/2 y = S [ (w2 − 1)(n+ 1)(n+ 3) 12(n− 2) ]1/2 A su vez, la kurtosis univariante (K) se transforma de una Gamma a una χ2 y luego en una Normal estándar, z 2, utilizando la transformada de Wilson & Hilferty (1931): z2 = √ 9a [( χ 2a ) 1 3 − 1 + 1 9a ] , con: χ = 2f(K − 1− S2) a = a+ S2c f = (n+ 5)(n+ 7)(n3 + 37n2 + 11n− 313) 12d c = (n− 7)(n+ 5)(n+ 7)(n2 + 2n− 5) 6d a = (n− 2)(n+ 5)(n+ 7)(n2 + 27n− 70) 6d Caṕıtulo 2. Redes Bayesianas (RB) 57 δ = (n− 3)(n+ 1)(n2 + 15n− 4) En el caso k-variable, el estad́ıstico Zt1 Z1 + Zt2 Z2 es aproximadamente una χ2 con 2k grados de libertad. Alcanzado este punto y a la vista de los posibles resultados del test multivariante de Normalidad surge la pregunta inevitable: cómo solucionar la situación en la que los datos disponibles de partida no pasan dicho test, sabiendo que no dispongo de más datos ni de más recursos? Si me baso en la construcción manual de la RBG y dispongo de un grupo de trabajo formado por expertos, se puede plantear utilizar otras variables aleatorias que sustituyan a las inicialmente propuestas. Pero, si me baso en la construcción automática de la RBG, mediante algoritmos, se incumplen los supuestos necesarios de partida. La única solución factible pasa por transformar, de alguna forma, la base de datos inicial tal que se cumpla la condición de Normalidad, pero sin modificar la correlación existente entre ellos. De lo contrario, obtendŕıamos resultados a partir de la transformación, que no seŕıan ni fiables ni acordes a los datos iniciales. Y por ello, no es factible la transformación de Box-Cox. 2.4.6. Distribución Nonparanormal La solución a lo indicado anteriormente está en la distribución Nonparanormal para transformar datos, a partir del ajuste de grafos no dirigidos propuesta por Lui et al. (2009), lo cual garantiza cumplir la condición de Normalidad para el caso multivariante. Esta transformación está incluida en el paquete huge (2012) de R. En las siguientes páginas se muestran las principales definiciones, propiedades, lemas que justifican la base teórica de esta transformación, fundamental para la utilización de bases de datos en RBG. Definición 2.1 Se dice que el vector X = (X1, ..., Xn) tiene distribución Nonpara- normal (npn) si existen funciones {fj} nj=1 tales que: Z ≡ f (x) ∼ N (µ, Σ) con f (x) = (f 1(x 1), ..., fn(xn)) La solución está en la distribución Nonparanormal para transformar datos, a par- tir del ajuste de grafos no dirigidos propuesta por Lui et al. (2009), lo cual garantiza Caṕıtulo 2. Redes Bayesianas (RB) 58 cumplir la condición de Normalidad para el caso multivariante. Esta transformación está incluida en el paquete huge (2012) de R. En las siguientes páginas se muestran las principales definiciones, propiedades, lemas que justifican la base teórica de esta transformación, fundamental para la utilización de bases de datos en RBG. Entonces X ∼ N (µ, Σ, f ), siendo las funciones fj monótonas y diferenciables, de tal forma que la funcion de densidad conjunta de X es: pX(x) = ( (2π)n/2|Σ|1/2 )−1 exp ( −1 2 (f(x)− µ)tΣ−1(f(x)− µ) )∏n j=1 |f ′ j(xj)|. Las siguientes propiedades garantizan la estimación del grafo: 1. Si X ∼ N (µ, Σ, f ) y cada fj es diferenciable, entonces la configuración de independencia condicionada de la información de partida, considerando las variables iniciales, permanece constante con la matriz Σ−1. 2. El grafo asociado a la matriz Σ−1, en cuanto a la configuración las variables que han sido transformadas manteniendo el supuesto de Normalidad, es igual en relación a la configuración de las variables de partida no Normales, lo cual se puede comprobar en los ceros de la matriz Σ−1. Teorema de Sklar (1959). Cualquier función de distribución acumulada conjunta se puede escribir a partir de las funciones de distribuciones acumuladas marginales como: F (x 1, ..., xn) = C{F (x 1), ..., F (xn)}, donde C es una funcion llamada copula. Teniendo en cuenta la distribución Nonparanormal, entonces: F (x 1, ..., xn) = Φµ,Σ (Φ−1(F1(x1), . . . , Fn(xn))) , siendo 1. Φµ,Σ función de distribución de una Normal Multivariante 2. Φ función de distribución de una Normal (estándar) Univariante. Caṕıtulo 2. Redes Bayesianas (RB) 59 Entonces, se consigue una copula Gaussiana con parametros µ y Σ, tal que: C (u1, ..., un) = Φµ,Σ(Φ−1(u1), ..., Φ−1(un)) Derivado del anterior teorema llegamos al siguiente lema: Lema. La distribución Nonparanormal es una cópula Gaussiana en el caso que las f ′ j sean monótonas y diferenciables. Por otro lado, teniendo en cuenta la estructura de la diagonal de la matriz Σ, y no la matriz de covarianzas completa, se puede asumir que la densidad de X, con X ∼ N (µ, Σ, f ), permanece igual si cumple la condición de que las funciones fj mantienen el valor de las medias y las varianzas, es decir: Sea Fj(x) la función de distribución acumulada de Xj, teniendo en cuenta que fj(Xj) se ajusta a una función de densidad Normal, entonces: Fj(xj) = P (Xj ≤ x) = P (Zj ≤ fj(x)) = Φ ( fj(x)−µj σj ) , y fj(x) = µj + σjΦ −1(Fj(x)) Considerando la anterior ecuación se pueden definir los parámetros y funciones de distribución marginales a estimar, para lo que se considera las especificaciones recogidas en el trabajo de Liu et al. (2009) y Lafferty et al. (2012). Por tanto, maximizar logW ′ sujeto a las restricciones correspondientes al cono- cimiento sobre los macro-estados, permite generar modelos para estimar los meso- estados más probables. En nuestro caso la matriz más probable T. Caṕıtulo 3 Modelos de transporte 3.1. Introducción El análisis de inversiones en grandes infraestructuras de transporte requiere la estimación, con largos horizontes de análisis de distintos aspectos. En primer lugar, cómo los usuarios de dichas redes (sean pasajeros o transportistas de mercanćıas) harán uso de las mismas si escogen unas alternativas frente a otras. Para ello hay que ver si un nuevo proyecto supone una mejora real para el conjunto de la población y de su sistema de transportes, de tal manera que compense los altos costes de inversión a los que se ha de hacer frente, verificando esto mediante un análisis coste-beneficio (ACB). Por tanto, conviene ver el nivel de endeudamiento y financiación necesarios, plan- teando posibilidades de internacionalización de la deuda, o planteando soluciones mixtas de participación público-privada (PPP). De cara a dar respuesta a estas cuestiones, los modelos de transporte proporcionan una herramienta útil para la toma de decisiones ya que proporcionan un marco estructurado en el cuál comparar alternativas de diseño y estimar cuotas de mercado en base a criterios técnicos. Además, un modelo de transporte facilita el análisis de resultados bajo diferentes escenarios, con los cuales evaluar cómo pueden afectar a la viabilidad de una propuesta diversos riesgos o fuentes de incertidumbre. 60 Caṕıtulo 3. Modelos de transporte 61 Figura 3.1: Modelo macroscópico de Estados Unidos de América (Fuente: Caliper Corp.) 3.2. Fundamentos previos 3.2.1. ¿Qué son y para qué se usan? Para el estudio de los modelos de transporte se necesita hacer representaciones virtuales de una red f́ısica, formada por arcos y nodos que poseen unas determi- nadas caracteŕısticas, en la que participan diferentes modos de transporte (aéreo, maŕıtimo/fluvial, terrestre). Se usan para la planificación del transporte en determinados ámbitos de estudio (barrios, ciudades, regiones, páıses, continentes): se planifican las infraestructuras (red de carreteras, puertos, ff.cc., aeropuertos, hidrov́ıas, corredores maŕıtimos,. . . ) actuales y futuras; se planifican las unidades a gestionar (veh́ıculos, personas, mer- canćıas), es decir, la demanda existente y la demanda proyectada. En las Figuras 3.1 y 3.2 se muestra algún ejemplo. 3.2.2. Objetivos principales Se debe empezar por investigar el comportamiento actual de pasajeros y mer- canćıas, para poder predecir ese comportamiento a futuro y proyectar las demandas. Esto lleva a la identificación y evaluación de problemas para pasar a la planificación de las actuaciones que deban llevarse a cabo. Caṕıtulo 3. Modelos de transporte 62 Figura 3.2: Modelo macroscópico de Madrid (Fuente: Ayuntamiento de Madrid (Cen- tral de Movilidad)) Caṕıtulo 3. Modelos de transporte 63 Figura 3.3: Desagregación de las diferentes etapas de viaje a lo largo de un d́ıa (Fuente: “Travel Demand Modelling” (Moshe Ben Akiva) – Massachusetts Institute of Technology (MIT)) 3.2.3. Tipoloǵıa y niveles de detalle Existen dos tipoloǵıas principalmente de modelos macroscópicos: los que están basados en viajes, en los que la unidad es un viaje entre un origen y un destino y son denominados habitualmente como modelos clásicos de cuatro etapas (four-step algo- rithm) y cuyas etapas son las siguientes: generación-atracción, distribución, reparto modal y asignación a la red de transporte; los que están basados en actividades, en los que se analiza la cadena de viajes en un d́ıa completo derivada de realizar una serie de actividades (tour-based model). En la siguiente figura se observa un ejemplo en el que se desagregan los viajes realizados durante un d́ıa, en diferentes actividades. Al realizar esta desagregación obtendré tantas matrices origen-destino como actividades individuales realizadas a lo largo del d́ıa, por lo que el ajuste de las matrices asociadas a cada actividad eleva la complejidad. En cuanto a los niveles de detalle de los modelos de transporte, dependiendo del “zoom” que se haga de la red, existen los siguientes a estudiar: el macroscópico, el mesoscópico, el microscópico y el h́ıbrido. Caṕıtulo 3. Modelos de transporte 64 3.3. Modelo clásico de cuatro etapas 3.3.1. Introducción Existe un gran número de metodoloǵıas que pretenden solucionar los problemas de transporte, tanto de mercanćıas como de pasajeros, y por lo tanto ayudar en las tomas de decisiones a efectos operativos y funcionales. Igualmente, en su evaluación económica, considerando que muchas de éstas siguen procesos similares en su desa- rrollo (Horn 2003). Inicialmente se define el ámbito geográfico, posteriormente se identifica la red de infraestructura que luego dará lugar a la red de arcos y nodos, se localizan los puntos de origen y destino de todos los posibles viajes (residenciales y productivos) que luego darán lugar a los centroides de la red (centros virtuales de gravedad), con darán lugar a las matrices origen-destino (OD) de los viajes. Estos oŕıgenes y destinos son los fletes, en el caso de las mercanćıas, y los centros residen- ciales y de trabajo, en el caso de los viajeros. Además, han de ser identificados todos los posibles medios de transporte que se pueden emplear, y por cada uno de ellos, por lo menos, sus costes (o tarifas) y tiempos de viaje ya que son las razones prin- cipales en las que se basa el fletador o el viajero para elegir el medio más atractivo. Los tiempos de viaje, a su vez, están formados por los tiempos de acceso/dispersion desde los puntos de origen y destino Además, considerando un transporte multimodal, como este caso, también hay que localizar y caracterizar las terminales intermodales (carretera-ferrocarril, ferrocarril- puerto,. . . ). Para ello se utiliza un modelo clásico de cuatro etapas de uso extendido en la planificación de transporte (Ortúzar, J.D., y Willumsen, L. G. (2011)) de mercanćıas y pasajeros, cuyas etapas se resumen a continuación: 1. Generación-Atracción. Una vez zonificada el ámbito de estudio y la red del mo- delo, se obtienen las toneladas de carga / número de viajeros generados/atráıdos en cada TAZ (Traffic Analysis Zones) o ZT (Zona de Transporte), normalmente en formato vectorial, mediante el ID (identificador) de cada zona. De tal forma que se obtiene: ID Generación, ID Atracción, Toneladas (o Viajeros). 2. Distribución espacial. Se transforma la información de generación-atracción Caṕıtulo 3. Modelos de transporte 65 Zonificación Datos año base Datos futuros Base de datos Generación Distribución Reparto modal Asignación a la red Evaluación it e r a c io n e s Figura 3.4: Modelo clásico de las cuatro etapas (Ortúzar and Willumsen 2011) a origen-destino, dando como resultado un conjunto de matrices de origen- destino (matrices OD), por ID, cuyas celdas representan las toneladas de mer- canćıas/número de viajeros. Explicar que, a su vez, estos resultados se pueden transformar a número de env́ıos (mercanćıas) y número de viajes (viajeros) en este punto o en el siguiente. 3. Reparto o elección modal. Es la clave de estos modelos ya que, en base a las caracteŕısticas de cada opción de viaje, la unidad de decisión (operador de mercanćıa/viajero) elige con una determinada probabilidad entre las diferentes opciones modales de transporte que existen. 4. Asignación a la red. De los flujos a cada tramo de la red modelizada, bien en número de veh́ıculos, bien en toneladas (caso de mercanćıas). En este caso es necesario transformar toneladas en veh́ıculos, teniendo en cuenta el ratio de toneladas/veh́ıculo o utilizando unidades de medidas internacionales, como los contenedores estándar o TEUs. En cualquier caso, las unidades de medida han de ser representativas y estas aceptadas internacionalmente para evitar confusiones, ya sean f́ısicas (longitud o peso), o monetarias. De esta forma, se obtienen resultados en cada tramo de red, en cada unidad correspondiente (viajes, número de env́ıos, toneladas, etc.), para cada modo de transporte. La Figura 3.4 resume la estructura básica de un modelo de cuatro etapas, incluyendo Caṕıtulo 3. Modelos de transporte 66 la etapa previa de zonificación del ámbito de studio y construcción de la red, aśı como los datos de partida y las bases de datos en las que se fundamenta. 3.3.2. Especificaciones del Modelo clásico de cuatro etapas A continuación, se resumen las especificaciones principales para los modelos de generación-atracción, distribución y reparto modal. La cuarta etapa de asignación, como su nombre indica, está basada en la asignación de los flujos de viajes (u otras unidades consideradas) a cada tramo de red utilizando diferentes algoritmos que cumplan el principio de equilibrio de Wardrop en la red modelizada. Modelos de Generación-Atracción. 1. Objetivo del modelo: cuantificar el número de viajes que se generan y se atraen en cada zona de transporte. 2. Especificación del modelo: Gi= −→ β ∗−→Xi Aj= −→ θ ∗−→Y j tal que ∑ iGi= ∑ j Aj 1. Método de estimación: Mı́nimos Cuadrados Ordinarios 2. Entradas necesarias para estimar el modelo: 3. Vectores de viajes generados/atráıdos observados por motivo de viaje 4. Variables de generación 5. Variables de atracción 6. Resultado del modelo: Vectores de viajes generados/atráıdos estimados por motivo de viaje Caṕıtulo 3. Modelos de transporte 67 Modelos de Distribución. 1. Objetivo del modelo: cuantificar de dónde a dónde se realizan los desplaza- mientos 2. Especificación del modelo: Vij= α∗Gβ i ∗A γ j C∗Gn ij , donde, Vij son los viajes generados en i y atráıdos en j, y CGij es el coste generalizado entre las zonas i y j 3. Método de estimación: Mı́nimos Cuadrados Generalizados 4. Entradas necesarias para estimar el modelo: 5. Matriz de viajes observados generados/atráıdos por motivo de viaje 6. Vectores de viajes generados/atráıdos estimados por motivo de viaje 7. Matriz de costes generalizados 8. Resultado del modelo: Matriz de viajes estimados generados/atráıdos por mo- tivo de viaje Modelos de Reparto Modal. 1. Objetivo del modelo: Cuantificar los viajes realizados en cada modo, basado en los valores observados (encuestas, datos de partida) 2. Especificación del modelo: Probabilidad (X): Pi = eUij(X)∑ i eUij 3. Método de estimación: Máxima Verosimilitud 4. Entradas necesarias para estimar el modelo: 5. Matriz de viajes observados por modos, de generados-atráıdos por motivo de viaje 6. Matriz de costes generalizados por motivos de viaje Caṕıtulo 3. Modelos de transporte 68 7. Resultado del modelo: Matriz de porcentajes, de cada modo de transporte, de viajes generados/atráıdos por motivo de viaje Como se ha indicado anteriormente, las matrices OD se pueden obtener bien mediante la transformación de los vectores de generados-atráıdos, bien mediante en- cuestación o análisis de datos históricos existentes de fuentes oficiales. Si los oŕıgenes y destinos de los viajes están perfectamente identificados, los procesos basados en encuestas resultan adecuados para conocer la tipoloǵıa de la mercanćıa transportada y los perfiles de los viajeros que hacen uso de la red, por modo de transporte, elimi- nando la incertidumbre asociada a información estimada o agregada, la cual siempre es menos fiable. Considerando lo indicado anteriormente, la evaluación de una infraestructura, funcional y económicamente (desde el punto de vista de la inversión y la rentabilidad), depende del número de usuarios que transiten por ella en sus veh́ıculos, tanto desde el punto de vista de viajeros como del de las mercanćıas, por tanto, la construcción de los modelos de transporte permite realizar dichas evaluaciones y relacionarlas. La siguiente figura representa de manera esquemática como es una red de trans- porte multimodal, en la que es necesario tener en cuenta los trazados de cada uno de los medios de transporte, sus puntos de encuentro con las terminales de intercambio modal necesarias y las caracteŕısticas de estas. Las variables mostradas son las que definen cada tramo, y están definidas en la siguiente Tabla. De manera general los nodos de la red serán los puntos de origen y destino, los puertos y los puntos de intercambio modal. Los tramos deberán tener en cuenta todos los trazados existentes de carreteras y autopistas, ferrocarril existente, tramos maŕıtimos y fluviales en explotación y todas las alternativas que se quieran evaluar no solo de ferrocarril sino de carretera o fluviales-maŕıtimas. Para el desarrollo de los siguientes apartados se toma de base la formulación matemática descrita en Ortúzar, J.D., y Willumsen, L. G. (2011)) en relación a los modelos de transporte, complementada con otros textos de modelos de regresión, funciones gamma, etc. Caṕıtulo 3. Modelos de transporte 69 Figura 3.5: Red multimodal Cuadro 3.1: Variables de las rutas Dm Distancia maŕıtima Tm Tiempo maŕıtimo Cm Coste maŕıtimo Df Distancia ferrocarril Tf Tiempo ferrocarril Cf Coste ferrocarril Dc Distancia carretera Tc Tiempo carretera Cc Coste carretera Tres Tiempo de espera Top Tiempo operaciones Cop Coste operaciones Caṕıtulo 3. Modelos de transporte 70 3.3.3. Etapa 1: Generación-Atracción de viajes. Partimos de cuatro formulaciones matemáticas básicas: modelos de factores de crecimiento, modelos de regresión, modelos de análisis de tasas de viajes, y modelos de clasificación cruzada. Formulación matemática: Recordando lo indicado anteriormente, los modelos de generación-atracción son tal que: Gi = f (Si1, Si2, . . . , Sin) Ai = f(Sj1, Sj2, . . . , Sjn) Donde f() son funciones asociadas a las variables socioeconómicas Ski , como los modelos de regresión lineal multiple indicados. La condición que se debe cumplir en los modelos degeneración atracción es la siguiente, siguiendo la condición de equilibrio de Wardrop de igualdad de flujos en un grafo: ∑ i Gi = ∑ j Aj Siendo Gi el número de viajes generados en la zona i, y Aj os viajes atráıdos por la zona j. Para que esta condición se cumpla, normalmente es necesario usar un factor de corrección: F = ∑ iGi∑ j Aj Por tanto, los viajes atráıdos finales serán el FAi. Modelos de Factores de Expansión. Se desarrollaron al principio y ahora solo se utilizan para predicciones a corto plazo o para calcular los viajes externos a una zona de estudio. El número de viajes futuros de una zona es el resultado de los viajes actuales Caṕıtulo 3. Modelos de transporte 71 multiplicado por un factor de expansión, tal que: Ti=Fiti, donde, 1. Ti , viajes de la zona i 2. Fi , factor de expansión 3. ti , viajes actuales de la zona i Calcular el valor del factor de expansión es el objetivo primero, tal que Fi puede ser de la siguiente forma: Fi = Xn i Y n i Z n i X0 i Y 0 i Z 0 i Siendo Xi, Yi , Zi variables socioeconómicas de la zona i (población, renta, PIB,. . . ). El supeŕındice 0 corresponde al año base y el supeŕındice n al año futuro. El procedimiento de estimación que propone este modelo es: 1. Determinar los valores actuales y futuros de las variables para cada zona y el volumen actual de viajes. 2. Estimar el valor del factor de expansión Fi. 3. Aplicar la formulación del modelo para cada zona en estudio. Modelos de Regresión. Normalmente son multivariables y de relación lineal o no lineal, en base a las variables seleccionadas. El modelo de regresión lineal multiple se muestral a continuación: Y = k + b1X1 + b2X2 + . . .+ bnXn, con Y la variable dependiente (viajes producidos o atráıdos por una zona); X1,. . . Xn las variables independientes; b1,. . . ,bn los coeficientes de la regresión lineal; k el término de la variable dependientes no explicado por las variables independientes. Caṕıtulo 3. Modelos de transporte 72 Aplicado a los modelos de transporte, en los modelos de generación la variable dependiente es el total de viajes generados por la zona, pudiendo ser a su vez, modelos de viajes zonales; de viajes basados en el hogar o desagregados (cuando al menos uno de los dos extremos del viaje es el hogar); o no basados en el hogar, en el caso complementario al anterior. Las variables independientes de un modelo zonal son aquellas socioeconómicas de la zona en su conjunto; las utilizadas en un modelo desagregado son atienden a las variables de las propias viviendas. La calibración del primero utiliza los datos existentes de la zonificación realizada, tal que cada observación es de una zona; mientras que en la calibración del modelo desagregado cada dato corresponde a cada vivienda de una muestra aleatoria tomada en el área en estudio. Modelos de Regresión Lineal Múltiple. Sea un conjunto de n observaciones k-dimensionales, es decir, x1 = (x11, . . . , x1k) , . . . , xn = (xn1, . . . , xnk) Entonces, a partir de dos variables aleatorias (X, Y), tal que X variable k dimen- sional, entonces se tiene un modelo lineal general si existen β0 y βj con j= 1, . . . ,k, verificando la siguiente condición: yi = β0 + k∑ j=1 xijβj + εi, i = 1, . . . , n Con yi la variable respuesta o dependiente; xj las variables independientes o regre- soras; βj los coeficientes de regresión; y finalmente εi variables aleatorias incorreladas de media 0 y varianza σ2, para todo i (término de error). De forma matricial el modelo lineal general quedaŕıa: Y = (Y1, . . . , Yn)t β = (β0, β1, . . . , βk) t Caṕıtulo 3. Modelos de transporte 73 ε = (ε1, . . . , εn)t X =  1 x11 1 x21 ... ... 1 xn1 x12 · · · x1k x22 · · · x2k ... xn2 · · · xnk  n×(k+1) Y entonces tendremos la siguiente forma matricial: Y = Xβ + ε, con E (ε) = 0 (vector de n ceros) y V (ε) =σ2In. A partir de la siguiente expresión podemos conseguir el estimador de β, tal que para cada i se tienen las distancias verticales al cuadrado entre las verdaderas ob- servaciones yi y las estimadas a través del plano β0+ ∑k j=1 xijβj cuyo objetivo es minimizar F (β) en β: F (β) = n∑ i=1 yi − β0 + k∑ j=1 xijβj 2 = (Y −Xβ)t(Y −Xβ) Este método corresponde al denominado de Mı́nimos Cuadrados, siendo: min β F (β) , Se calcula: ∂F ∂β = −2X tY + 2X tXβ = 0, y se obtiene X ′ Xβ=X ′Y , de donde: β̂ = ( X tX )−1 X tY Por lo tanto, Caṕıtulo 3. Modelos de transporte 74 Ŷ = Xβ̂ = X ( X tX )−1 X tY = HY, siendo H matriz simétrica e idempotente. Finalmente, se obtiene ε̂i=Yi−Ŷi, para cada i= 1, . . . ,n. ε̂ = (ε̂1, . . . , ε̂n)t = Y − Ŷ = Y −Xβ̂ = Y −X ( X tX )−1 X tY = (I −H)Y. 3.3.4. Etapa 2: Distribución de viajes El objetivo de los modelos de distribución de viajes es doble. Por un lado, ajustar en base a factores los viajes generados y atráıdos de la etapa anterior, y por otro lado, transformar los viajes generados-atráıdos en viajes origen-destino. Por tanto, al final de esta etapa podremos conocer los viajes entre las diferentes zonas de mi ámbito de estudio. Los dos métodos más habituales en planificación de transporte son: 1) factores de crecimiento, basado en escalar una matriz existente aplicando factores multiplicativos derivados de estimaciones de generación-atracción asociadas a las celdas de la matriz; 2) modelo gravitacional, considerando la hipótesis de la existencia de medidas de impedancia entre las zonas como son: la distancia de viaje, el tiempo de viaje y su coste, aśı como otras funciones potenciales de impedancia que pueden ser usadas para derivar la atracción relativa de cada zona. Aśı, en los modelos gravitacionales los viajes entre las zonas i y j pueden mo- delizarse en función de los viajes originados en las zonas i y el nivel de atracción y accesibilidad de la zona j con respecto a las demás zonas, considerando estas fun- ciones de impedancia entre las zonas, las cuales están asociadas a la desutilidad del viaje. Este concepto de utilidad y desutilidad es de suma importancia en la etapa siguiente de reparto modal. Siguiendo el śımil de la ley de gravitación entre dos objetos, en este caso las zonas del ámbito, la “fuerza gravitatoria” (los viajes) decrece en función de la distancia que separa las zonas. Ya que el resultante de la etapa anterior es un vector de viajes generados y un Caṕıtulo 3. Modelos de transporte 75 Figura 3.6: Matriz de viajes. Fuente: Modelling Transport Manual (Ortúzar, J.D., y Willumsen, L. G. (2011)) vector de viajes atráıdos, para cada zona, es necesario transformar estos vectores en forma matricial para una mejor interpretación. A continuación se indican los elementos básicos del modelo: 1. Matriz de viajes, con oŕıgenes en las filas y destinos en las columnas para representar el número de viajes que se producen de un origen i a un destino j. La notación es la siguiente: a) Tij: número de viajes entre el origen i y el destino j b) Oi: número total de viajes con origen en la zona i c) Dj: número total de viajes atráıdos por la zona j d) las celdas de cada una de las filas i contienen los viajes con origen en la zona i y destino en las zonas j. e) la diagonal principal corresponde a los viajes intrazonales. Estas matrices de partida pueden filtrarse según el modo de transporte, la segmentación de la población, basados o no basados en el hogar, la franja horaria (AM, PM, Valle), el motivo del viaje, etc. La suma de los viajes en una fila es igual al número total de viajes generados en esa zona; la suma de los viajes en una columna es el número total de viajes Caṕıtulo 3. Modelos de transporte 76 atráıdos a esa zona. Entonces: ∑ i Tij = Oi ∑ j Tij = Dj Dependiendo de la cantidad y calidad de información de partida el modelo es doblemente restringido, si se cumplen ambas condiciones; o únicamente res- tringido, según se tenga sólo los generados o sólo los atráıdos. 2. Impedancias, en términos de distancia, tiempo o unidades monetarias. En este punto se define el conocido como coste generalizado de viaje, que es una medida combinada de todos los principales atributos relacionados con la desuti- lidad de un viaje. Normalmente es una función lineal de los atributos del viaje aplicando un peso asociado a los coeficientes que representan su importancia relativa como la percibe el viajero. Aśı para el modo de transporte k se tiene: cij = a1t v ij + a2t w ij + a3t t ij + a4tnij + a5Fij + a6φj + δ, donde, si utilizamos variables como el tiempo, la tarifa (coste) y alguna posible penalización (por restricciones de viaje), entonces se definen: a) tvij: tiempo de viaje en el veh́ıculo entre i y j b) twij: tiempo andado hasta y desde las paradas o estaciones c) ttij: tiempo de espera en las paradas d) tnij: tiempo de intercambio e) Fij: tarifa de ir de i a j f ) φj: coste final (como podŕıa ser, por ejemplo, el coste de un aparcamiento) g) δ: penalización modal (representa todos los demás atributos no incluidos en la medida generalizada, como la seguridad y la comodidad) h) a1, a2, a3, a4, a5, a6: pesos atribuidos a cada elemento del coste Caṕıtulo 3. Modelos de transporte 77 Para poder hallar la matriz existen tres métodos: 1) el método del factor de crecimiento; 2) el modelo de distribución gravitacional; 3) la maximización de la entroṕıa. Modelo del Factor de Crecimiento. Se aplica si no se tiene información dispo- nible relativa a las impedancias interzonales de la red: distancias, tiempos de viaje o costes generalizados. Existen los siguientes tipos: 1. Factor de crecimiento promedio: distribuye los viajes futuros aplicando a la distribución actual el promedio de crecimiento esperado de la generación de viajes de una zona i y del crecimiento esperado de la atracción de viajes de otra zona j. En el caso de que la única información disponible sea un grado general de crecimiento τ para el ámbito de estudio, se aplicará a cada celda de la matriz el siguiente valor: Tij = τ ·tij para cada par i, j. 2. Factor de crecimiento únicamente restringidos: 1) si existe información del crecimiento esperado en viajes que se originan en cada zona se aplica este factor de crecimiento espećıfico de origen (τi) a las correspondientes filas de la matriz de viajes; 2) si existe información del crecimiento esperado de viajes atráıdos en cada zona se aplica el factor de crecimiento espećıfico de destino (τj) a las correspondientes columnas, tal que: Tij = τitij para los factores espećıficos de origen Tij = τjtij para los factores espećıficos de destino 3. Factor de crecimiento doblemente restringidos: en este caso se conoce el número de viajes futuros generados y atráıdos en cada zona. Estos métodos requieren el cálculo de un conjunto de coeficientes de corrección intermedios que se aplican a cada celda de entrada, en cada fila o columna Caṕıtulo 3. Modelos de transporte 78 según convenga. En el caso de asignar estas correcciones a cada fila, se calcu- lan los totales para cada columna y se comparan con los valores objetivos. Si las diferencias son significativas, se calculan y aplican nuevos coeficientes de corrección. Entonces se aplica el siguiente proceso iterativo: a) Considerar a todos los bj = 1 y resolver para los ai; es decir, hallar los factores de corrección ai que cumplan las restricciones relativas a la gene- ración de viajes. b) A partir de los últimos valores obtenidos para los ai, hallar los bj; de manera que se cumplan las restricciones relativas a la atracción de viajes. c) Manteniendo fijos los valores de los bj, resolver para los ai y repetir los pasos 2 y 3 hasta que los cambios sean suficientemente pequeños. Modelo de distribución gravitacional. Estima los viajes para cada celda en la matriz sin utilizar directamente el esquema de viajes observados; por tanto, se les llama algunas veces como métodos sintéticos como oposición a los modelos de factor de crecimiento. Su primera formulación y más simple es tal que: Tij= αPiPj dij En este caso se consideran como variables aleatorias de referencia Pi y Pj , las poblaciones de las zonas del ámbito de estudio; dij la distancia entre i y j; y α un factor de proporcionalidad. Posteriormente se incluyeron mejoras como la utilización de los totales de los viajes finales (Oi y Dj), en lugar de las poblaciones totales, y un parámetro n para la calibración de la potencia de dij. Este parámetro n, no se restringió a los números enteros y ciertos estudios estimaron su valor entre 0.6 y 3.5. En este caso el modelo resultante es: Tij = αOiDjf (cij) , donde f (cij) es una función de costes generalizados de viaje con uno o más paráme- tros para la calibración; esta función se conoce como función de disuasión que re- Caṕıtulo 3. Modelos de transporte 79 presenta un grado de penalización al viaje al aumentar el coste o la distancia. Las formas más utilizadas de esta función son: 1. Función exponencial: f (cij) = exp (−βcij) 2. Función potencial: f (cij) = c−nij 3. Función combinada: f (cij) = c−nij exp (−βcij) De cara a asegurar el cumplimiento de las restricciones de los totales por oŕıgenes y destinos, se reemplaza el factor α de proporcionalidad por dos conjuntos de factores de balanceado: Ai y Bj obteniendo entonces el Modelo Gravitacional Doblemente restringido en su forma habitual, tal que: Tij=AiOiBjDjf (cij) . El modelo únicamente restringido por origen o por destino, considera uno de los conjuntos de factores de balanceado Ai o Bj, igual a 1. 1. Para un modelo restringido por oŕıgenes, Bi= 1 para todo j, y Ai= 1∑ j Djf(cij) 2. Para el caso restringido por destinos seŕıa análogo cambiando las posiciones de Ai y Bj. El modelo doblemente restringido, considera los valores de los factores de balan- ceado: Ai= 1∑ j BjDjf (cij) Bj= 1∑ iAiOif (cij) Entonces los factores de balanceo son interdependientes, es decir, para calcular un conjunto de factores se necesita utilizar los valores del otro conjunto y viceversa. Por ese motivo es necesario realizar iteraciones análogas a las de Furness que, en la práctica, producen buenos resultados. Caṕıtulo 3. Modelos de transporte 80 Luego, dado un conjunto de valores para la función de fricción (o impedancia o de resistencia al viaje) f(cij), el proceso inicializa con todos los Bj= 1, calculando los va- lores de Ai mediante la primera fórmula descrita anteriormente. A continuación, con estos valores hay que reestimar de nuevo los Bj y repetir estos pasos iterativamente hasta que el proceso converja. Una versión más general de la función de fricción puede incluir valores emṕıricos que dependen sólo del coste generalizado de viaje. Los costes de viaje se agregan entonces en un número pequeño de intervalos de coste (10 ó 15), indicados con el supeŕındice m , de tal forma que la función de fricción queda aśı: f (Cij) = ∑ m Fmδmij Donde Fm es el valor medio del coste para el intervalo m, mientras que δmij es igual a 1 si el coste de viaje entre i y j pertenece al intervalo m, e igual a 0 en otro caso. La formulación de la función potencial y exponencial tienen solamente un paráme- tro a calibrar. La formulación de la combinada tiene dos parámetros. Mientras que la fórmula anteriormente indicada tiene tantos parámetros como in- tervalos. Estos parámetros se estimados tal que los resultados obtenidos reproduzcan lo más fielmente posible la distribución de longitudes (costes) de los viajes (DLV o, en inglés, Trip Length Distribution, TLD) observados. El programa de modelización de transporte TransCAD incluye esta opción. De tal forma que se calcula la matriz O-D a través de la siguiente fórmula: Tij=kGiAjf (Cij) = GiAjf (Cij)∑ Ajf (Cij) , con: 1. Tij: viajes con origen en la zona i y destino en la zona j. 2. Gi: total de viajes generados en la zona i 3. Aj: total de viajes atráıdos por la zona j Caṕıtulo 3. Modelos de transporte 81 4. f (Cij): función de coste entre i y j 5. k: constante de proporcionalidad En este caso se asume que Bj= 1 y la función de coste es el tiempo (minutos) de viaje entre la zona i y la zona j. Usualmente se puede usar la notación Vij en lugar de Tij. Maximización de la entroṕıa. Se define la entroṕıa como la probabilidad relacio- nada con la incertidumbre respecto a la información de que se dispone inicialmente. Se consideran tres niveles de información: 1. Macro-estado: Viajes generados y atráıdos por cada zona. Oi y Dj. 2. Meso-estado: Viajes realizados entre una zona i y una zona j. 3. Micro-estado: Viajes de un individuo desde un origen i a un destino j. El número de micro-estados W{T ij} asociados al meso-estado Tij viene dado por: W{T ij}= T ! πijTij! Suponiendo a todos los micro-estados igualmente probables, el meso-estado más probable es aquel que puede generarse por un gran número de formas. Entonces, se necesita una técnica para identificar los valores que maximizan W en la expresión anterior. Se considera entonces tomar logaritmos tal que: logW=log T ! πijTij! =logT !− ∑ ij logTij! Utilizando la aproximación de Stirling, entonces tengo logX! =XlogX−X logW=logT !− ∑ ij (TijlogTij−Tij) Y como logT ! es una constante, el problema se reduce a maximizar la expresión logW ′ = − ∑ ij (TijlogTij−Tij), Caṕıtulo 3. Modelos de transporte 82 que es la que se conoce como función de entroṕıa. 3.3.5. Etapa 3: Reparto o elección modal En la anterior (segunda) etapa se obtiene como resultado final una matriz OD con los viajes entre cada una de las zonas. El objetivo de esta tercera etapa es cuantificar cuántos de esos desplazamientos se producen en cada modo de transporte, calculando las probabilidades de uso de cada uno de ellos. El motivo es que conocer la elección del modo de transporte en escenarios futuros es clave en la planificación del transporte para la toma de decisiones, dado que condiciona totalmente las inversiones en infraestructuras a largo plazo. Además, conocer la elección modal influye en la eficiencia general del sistema del transporte en el escenario actual, en la cantidad del espacio urbano dedicado a las funciones del transporte, aśı como en el conjunto de alternativas disponibles o no para los viajeros. Todo esto está relacionado con las poĺıticas en materia de movilidad, sociales, urbańısticas y de medio ambiente. Los modelos de reparto modal se utilizan para analizar y predecir las elecciones que realizan los individuos o grupos de individuos en cuanto al modo de transporte del viaje. Normalmente, el objetivo es predecir la cuota porcentual de cada modo en todas las relaciones origen-destino con el fin de obtener una matriz O-D para cada modo. Esto implica que es importante desarrollar y utilizar modelos que sean sensibles a aquellos atributos del viaje que influyen en las elecciones individuales del modo. Los modelos aplicados después de la fase de distribución permiten tener en cuenta las caracteŕısticas del viaje y de las alternativas disponibles para realizarlo, si bien es dif́ıcil incluir las caracteŕısticas de los viajeros que ya se han agregado en la matriz de viajes de la etapa anterior. Maximización de la utilidad. Los factores que influyen en la elección modal se pueden clasificar en tres grupos: 1. Personal: disponibilidad de veh́ıculo, estructura del hogar, ingresos, . . . Caṕıtulo 3. Modelos de transporte 83 2. Viaje. La elección del modo está fuertemente influenciada por el propósito del viaje y por el peŕıodo del d́ıa en el que se realiza el viaje. Aśı, los viajes realizados en las últimas horas del d́ıa se realizan con mayor dificultad en transporte público. 3. Modo de transporte, que se dividen en dos categoŕıas: 1) formada por fac- tores cuantitativos como el tiempo relativo del viaje: tiempo de viaje a bordo del veh́ıculo, de espera y a pie por cada modo o por el coste del viaje; 2) for- mada por factores cualitativos, menos fáciles de medir, como la confiabilidad y regularidad. Los modelos de elección modal pueden ser agregados (si se basan en datos a nivel zonal e interzonal) o desagregados (si se basan en datos familiares o individuales). Los modelos agregados generalmente utilizan el concepto de coste generalizado mien- tras que los modelos desagregados pueden incluir potencialmente la mayoŕıa de los factores anteriormente mencionados. Los modelos de elección discreta afirman: “La probabilidad de que los individuos elijan una determinada alternativa es función de sus caracteŕısticas socioeconómicas y de la relativa atractividad de la alternativa.” Para representar la atractividad de la alternativa se utiliza el concepto de utilidad. La utilidad medible u observable se define generalmente como una combinación lineal de variables donde cada variable representa un atributo de la alternativa o del viajero, en tanto que los coeficientes representan la influencia relativa de cada atributo, es decir, la contribución que cada variable aporta al agrado total producido por cada alternativa. La constante de la función de utilidad se puede interpretar como la representa- ción de la influencia neta de todas las caracteŕısticas, tanto del individuo como de la alternativa de transporte, no observadas o no expĺıcitamente incluidas en dicha función de utilidad. La constante espećıfica puede incluir, por ejemplo, elementos tales como el confort o la fiabilidad, que son variables nada fáciles de medir o de observar. De acuerdo con el modelo, para poder predecir si una alternativa es elegida, el valor de su utilidad se ha de comparar con el valor de las utilidades de las opciones alternativas y transformarse en un valor de probabilidad entre 0 y 1. Para ello, existe Caṕıtulo 3. Modelos de transporte 84 una gran variedad de transformaciones matemáticas, cuyas gráficas tienen forma de S y de entre las cuales se destacan las siguientes: 1. Logit: P1= exp (V1) exp (V1) +exp(V2) . 2. Probit: P1= ∫ ∞ −∞ ∫ V1−V2+x1 −∞ exp { − 1 2(1−p2) [( x1 σ1 )2 −2px1x2 σ1σ2 + ( x2 σ2 )2 ]} 2πσ1σ2 √ (1−p2) dx2dx1, donde la matriz de covarianzas de la distribución Normal asociada a este último modelo tiene la forma siguiente: ∑ =  σ2 1 pσ1σ2 pσ1σ2 σ2 2 . Los modelos de elección discreta no se pueden calibrar utilizando técnicas clási- cas de ajuste de curvas, como, por ejemplo, el método de los Mı́nimos Cuadrados, porque su variable dependiente Pi es una probabilidad no-observada (entre 0 y 1). mientras que las observaciones son las elecciones realizadas por los individuos (que son solamente 0 ó 1); las únicas excepciones al respecto son los modelos para grupos homogéneos de individuos, o cuando el comportamiento de cada individuo se regis- tra en varias ocasiones, porque, de hecho, las frecuencias observadas de elección son también variables comprendidas entre 0 y 1. Spear (1977) realizó una conveniente śıntesis de algunas propiedades importantes de estos modelos: Por su parte, los modelos desagregados de demanda (DM) se basan en teoŕıas de comportamiento individual y no constituyen analoǵıas f́ısicas de ningún tipo. Por ese motivo, cuando intentan explicar dicho comportamiento, presentan una importante ventaja potencial respecto a los modelos convencionales, en el sentido de que es más probable que sean estables en el tiempo y en el espacio. Caṕıtulo 3. Modelos de transporte 85 Los DM se estiman utilizando datos individuales, lo que implica que: 1. En lo referente a la utilización de información pueden ser más eficientes que los modelos convencionales; de hecho, requieren un número menor de datos ya que la elección de cada individuo puede ser utilizada como una observación. 2. Asimismo, el utilizar datos individuales hace que se pueda tener en cuenta toda la variabilidad inherente a dichas informaciones. 3. Una menor probabilidad de que se vean afectados por distorsiones debidas a la correlación entre unidades agregadas. Los modelos desagregados son probabiĺısticos; ello implica que como proporcionan la probabilidad de elegir cada alternativa, sin indicar cuál se selecciona, se deben utilizar conceptos básicos de la teoŕıa de las probabilidades, tales como: 1. El número esperado de personas que utilizan una cierta alternativa de viaje es igual a la suma, sobre todos los individuos, de la probabilidad de elección de dicha alternativa: Ni= ∑ Pinn 2. Es posible modelizar un conjunto de decisiones independientes considerando a cada una como una elección condicionada; en este caso separadamente, las probabilidades resultantes pueden ser multiplicadas para obtener las probabi- lidades conjuntas, tal que: P (f, d, m, r) =P (f)P (d/f)P (m/d, f)P (r/m, d, f) Las variables explicativas incluidas en el modelo pueden tener coeficientes expĺıci- tamente estimados. Contrariamente a lo que sucede en el caso del coste generalizado de los modelos convencionales, en los que la función está generalmente limitada y presenta numerosos parámetros fijos, en la función de utilidad es posible, en prin- cipio, insertar un número cualquiera de variables explicativas con cualquier tipo de especificación. Caṕıtulo 3. Modelos de transporte 86 Al modelizar el comportamiento de los distintos usuarios del sistema seŕıa nece- sario conocer todas las caracteŕısticas que han tenido en cuenta a la hora de hacer su elección. Esto es imposible, ya que no se llega a tener nunca una información comple- ta acerca de lo que los individuos consideran a la hora de elegir una alternativa. Por esta razón la utilidad de las alternativas Uiq se representa con la siguiente ecuación: Uiq=Viq+εiq. Viq: Parte medible de la Utilidad, Utilidad sistemática o representativa, que es función de los atributos medidos X, siendo: Viq= ∑ θkikXkiq donde θ se considera constante para todos los individuos. εiq: Parte aleatoria que refleja la idiosincrasia y gustos particulares de cada indi- viduo, además de errores de medición y observación cometidos por parte del equipo investigador. Es importante enfatizar la existencia de dos puntos de vista en la formulación de este problema: 1) el individuo que sopesa todos los elementos de interés (sin aleatoriedad) y a continuación elige la alternativa más conveniente; 2) el modelizador, el cual observando solamente algunos de los elementos, necesita incluir los residuos ε para explicar lo que de otra manera podŕıa constituir un comportamiento no racional. Por tanto, el individuo elige la alternativa que le proporciona su máxima utilidad, es decir elige Aj si, y sólo si: Ujp≥Uiq ∀Ai ∈A(q) Es decir, Vjq−Viq≥εiq−εjq. Maximización de la entroṕıa. El enfoque de maximización de la entroṕıa puede utilizarse para generar modelos simultáneos de distribución y elección modal. Para Caṕıtulo 3. Modelos de transporte 87 ello, es necesario formular el problema de maximización de la entroṕıa; es decir maximizar la siguiente expresión: logW ( T kij ) = − ∑ ijk ( T kijlogT k ij−T kij ) , sujeto a ∑ jk T kij−Oi= 0 ∑ ik T kij−Dj= 0 ∑ ijk T kijC k ij−C= 0 Lo cual nos lleva a la siguiente solución: T kij=AiOiBjDjexp ( −βCk ij ) P l ij= T lij Tij = exp ( −βCk ij ) ∑ k exp ( −βCk ij ) , donde P l ij es la proporción de viajes realizados entre i y j con el modo l (k son los diferentes modos). Las principales propiedades que presenta P l ij son las siguientes: 1. Genera una curva en forma de “S” conocida como curva de partición modal. 2. Si C1=C2= . . . =Cn para todos los valores de k entonces P1=P2= . . .Pn= 1 n . Es importante mencionar que en esta formulación β juega un doble papel, por un lado, como parámetro que controla la dispersión en la elección modal y por otro en la elección de diferentes destinos que se encuentran a distancias diferentes del origen. Por este motivo, a veces se prefiere no tener un solo parámetro sino tener varios, apareciendo aśı un modelo más práctico de la forma: Caṕıtulo 3. Modelos de transporte 88 T knij =Ani O n i BjDjexp ( −βnKn ij ) exp ( −λnCk ij ) ∑ k exp ( −λnCk ij ) Donde Kn ij es el coste compuesto de viaje entre i y j percibido por el individuo de tipo n. El coste compuesto puede ser especificado de muchas formas diferentes pero la mejor forma suele ser tomar su promedio ponderado: K= ∑ k P kCk. También se ha establecido que la única especificación correcta compatible con la teoŕıa predominante del comportamiento de elección racional es: Kn ij= −1 λn log ∑ k exp ( −λnCk ij ) Donde se tiene que satisfacer la restricción: βn≤λn Y, además, esta medida de coste compuesto tiene las siguientes propiedades: 1. K = mink ( Ck ) 2. limλ→∞K=mink ( Ck ) 3. dK dCk =P k 3.3.6. Etapa 4: Asignación a la red En esta fase se utiliza la información de la matriz OD de viajes de la anterior etapa para asignarlos a la red modelizada del ámbito de estudio. Es decir, se obtiene como resultado final del modelo la cantidad de viajes que pasan por cada uno de los arcos en diferentes modos. El objetivo es encontrar las rutas optimas mediante diferentes algoritmos que dependen del tipo de transporte utilizado. Caṕıtulo 3. Modelos de transporte 89 1. Transporte privado. Se sigue el principio de equilibrio de Wardrop. Bajo condiciones de equilibrio el tráfico se distribuye en la red tal que todas las rutas usadas entre un par origen-destino tienen el mismo coste y cualquier otra ruta tiene mayor coste. 2. Transporte público (TP). Se aplica un procedimiento probabiĺıstico que reparte los flujos en TP entre las rutas mono o multimodales lógicas que puedan generarse para cada par origen-destino. La notación utilizada es la siguiente, Tijr: Número de viajes entre i y j por el recorrido o ruta r. Va: Flujo en el arco a. C (Va): Relación coste-flujos para el arco a. c (Va) : Coste efectivo para un nivel espećıfico de flujo Va. En el caso de que Va= 0 se trata del coste a flujo libre. cijr: Coste de viajar de i a j por el recorrido r. δaijr=  1 0 si el arco a pertenece al recorrido r desde i a j en otro caso n: Indica una iteración particular en los métodos iterativos. ∗ : Indica el valor óptimo Durante esta etapa se utilizan una serie de principios para cargar una matriz de viajes a la red y obtener unos flujos en los arcos. Los objetivos son los siguientes: 1. Obtener resultados agregados de red. 2. Estimar costes de viaje entre zonas para un nivel de demanda dado. 3. Conseguir valores razonables de flujos en los arcos e identificar los arcos que estén más congestionados. Caṕıtulo 3. Modelos de transporte 90 4. Estimar los recorridos utilizados para cada par O-D. 5. Analizar qué pares O-D utilizan arcos o rutas particulares. 6. Obtener los flujos de veh́ıculos que realizan giros para poder aśı diseñar futuras intersecciones. Los requerimientos básicos para esta etapa son: 1. Una matriz de viajes que exprese la demanda estimada. Es común que esta matriz se refiera a una franja horaria punta en un área congestionada. En el caso de redes no congestionadas se usan matrices diarias. 2. Una red: los arcos y sus propiedades. 3. Principios y reglas de selección de los recorridos relevantes para el problema. Se atribuye a dos factores que los individuos elijan diferentes recorridos cuando se desplazan entre el mismo par O-D: las diferencias individuales de los individuos sobre cuál es el mejor recorrido; los efectos que tiene la congestión, que hace que los costes de los trayectos más cortos aumenten. La construcción de un buen árbol de asignación en esta etapa en los métodos de asignación sirve para ahorrar tiempo y costes. En los algoritmos que veremos en el siguiente apartado, indicaremos con dA,B como la longitud (esto es, el coste) de un arco entre A y B en la red. La ruta se define por una serie de nodos unidos. Con dA se denota la distancia mı́nima para alcanzar el centroide A desde el nodo ráız S del árbol. 3.3.7. Métodos de asignación Los métodos de asignación son los siguientes: 1. Asignación todo o nada. Este método supone que no hay congestión lo que se traduce en que los costes de los arcos son fijos. Además, se supone que todos los individuos tienen que percibir de la misma manera el coste. Esto es, todos los individuos que se desplazan de i a j,tienen que elegir la misma ruta. Caṕıtulo 3. Modelos de transporte 91 Estas suposiciones son razonables en redes poco congestionadas y con pocas alternativas de recorridos. Todos los algoritmos de carga de la red comienzan con una fase inicial, hay que determinar los flujos VA,B en los arcos entre los nodos A y B. Aqúı se comienza con VA,B= 0. Podemos aplicar dos métodos para resolver el problema: a) Par por par: se parte de un origen y un destino a la vez. Inicialmente, VA,B= 0, luego para cada par (i, j) : Se fija B igual al destino j Si (A,B) es el arco predecesor de B entonces VA,B=VA,B+Tij Se fija B igual al destino A Si A=i finalizamos. En otro caso, se vuelve al segundo paso. b) En cascada: a partir del origen i se carga sobre los arcos los flujos acumu- lados de los nodos siguiente los árboles de mı́nimo coste. Sea VA el flujo acumulado en A: Se fijan todos los VA= 0 expecto para el destino en que Vj=Tij. Se fija B igual a la mayor distancia al nodo más lejano desde i. VA=VA+VB VA,B=VA,B+VB Se fija B igual al siguiente nodo más lejano. Si B=i el origen ha sido alcanzado y se vuelve a comenzar por el origen siguiente. En otro caso, se vuelve al tercer paso. 2. Métodos estocásticos. Estos métodos ponen en manifiesto la variabilidad por parte de los individuos de la percepción de los costes y tratan de minimizar la distancia, el tiempo de viaje y los costes. Es necesario tener en cuenta el mejor recorrido, pero también los recorridos siguientes a este, hablando en términos de costes calculados por el modelizador. Se denominan los “second best routes” y el número de rutas alternativas entre cada par origen-destino es muy grande. Se usan dos métodos importantes: 1) el primero de ellos seŕıan los métodos que se basan en la simulación, utilizando en este caso métodos de Monte Carlo Caṕıtulo 3. Modelos de transporte 92 para representar las diferentes percepciones de los usuarios sobre los costes; 2) el segundo se basa en proporciones, estos asignan flujos a las diferentes rutas alternativas de recorrido de proporciones calculadas utilizando expresiones tipo logit. 3. Asignación con congestión. En la asignación con congestión nos centra- remos en modelos que buscan aproximarse a las condiciones de equilibrio de Wardrop. Con estos modelos se concentra la atención en las restricciones de capacidad. Los modelos con restricciones de capacidad usan funciones que re- lacionan el flujo con los costes de viaje sobre los arcos. El equilibrio de Wardrop: “Bajo condiciones de equilibrio, el tráfico se distri- buye en las redes congestionadas de modo tal que ningún viajero puede reducir su propio coste de viaje cambiando el recorrido”. Se usa el indicador δ= ∑ ijr Tijr(Cijr−C∗ijr)∑ ij TijC ∗ ij para valorar en qué medida la solución se acerca al equilibrio de Wardrop. Se trata de una medida sobre coste total debido al hecho de usar recorridos peores, esto es, diferentes a los del coste mı́nimo. El segundo principio de Wardrop “Bajo condiciones de equilibrio social en redes congestionadas, el tráfico debeŕıa distribuirse de tal modo que los costes medios (o totales) de viaje sean mı́nimos”. 3.4. Consideraciones de los modelos de elección modal Por un lado, un aspecto clave en el desarrollo de modelos de transporte es la estimación del reparto modal entre una serie de alternativas. Por otro lado, la de- cisión del modo de transporte a la que se enfrenta un individuo es de naturaleza discreta. Por lo tanto, los modelos de elección discretos son a menudo los elegidos Caṕıtulo 3. Modelos de transporte 93 para el análisis del modo de decisión. Estos predicen las elecciones hechas por una unidad de decisión dentro de un conjunto discreto de alternativas. Sin embargo, los modelos de elección discretos están formulados como modelos estocásticos, en los que la probabilidad, con la que determinada respuesta es observada, es una función de un conjunto de variables explicativas. Los modelos de elección discreta persiguen precisamente estimar cómo distintos decisores escogen entre una serie de opciones que pueden corresponder a distintos modos de transporte, combinaciones de modos o configuraciones de un modo de transporte en función de un conjunto de factores que determinan la elección (Ortúzar, J.D., y Willumsen, L. G. (2011)). En el transporte de pasajeros y mercanćıas, los dos factores más determinantes en la elección modal son el tiempo y el coste de viaje por cada opción, aunque debido a la disparidad existente entre los criterios seguidos por usuarios distintos, se considera adecuado el uso de modelos probabiĺısticos frente a modelos determińısticos de forma que se contemple la variabilidad en las decisiones de los usuarios del medio de transporte. Por tanto, el modelo de elección ha de proporcionar la probabilidad de uso de una alternativa, y esa probabilidad es usada en un modelo de transporte (agregado usualmente), como la proporción de usuarios que toman la alternativa. Con el objetivo de evaluar la captación de tráficos que proporciona un determina- do modo de transporte frente a sus alternativas, se emplea una metodoloǵıa basada en el empleo de modelos de elección discreta. Los más populares aplicados en la práctica son los modelos logit, los cuales pue- den subdividirse en varios tipos. Los modelos de elección discretos son en muchos aspectos un sustituto para los modelos de regresión cuando la variable dependiente es cualitativa o categórica y no continua, y dichos modelos de regresión no se ajustan a la modelización de variables dependientes discretas por violaciones de los supuestos de mı́nimos cuadrados (Aldrich and Nelson, (1984)). Los principales modelos logit utilizados son los Multinomial Logit (MNL), los Binary Logit (BL) y los modelos lo- git anidados NML (Nested Logit Models) que son variaciones que parten de hipótesis más complejas. Además de estos modelos, también podemos destacar la utilización de las Redes Neuronales (RN) o Neural Networks (NN), aunque en menor medida. En el caso de los MNL, se trata de una metodoloǵıa robusta y ampliamente extendi- Caṕıtulo 3. Modelos de transporte 94 da en la práctica, que permite determinar las probabilidades de que diversos agentes tomen unas decisiones u otras en función de un conjunto de factores determinantes de la elección. Concretando algo más, los modelos de elección discreta están basados en la teoŕıa de la utilidad aleatoria, cuyas asunciones se pueden resumir en (Ortúzar and Willumsen, (2011)): existe una población homogénea formada por un conjunto de individuos que disponen de información “perfecta”; el conjunto total de alternativas (de cada modo de transporte) está disponible para ellos; cada alternativa de transporte (j) tiene una utilidad de red por cada individuo (p), que se define como la suma de dos componentes, una función medible de ciertos factores que afectan a la elección del modo de transporte (Vjp), y una componente aleatoria de cada individuo tomada como una medida del error observado (εjp). Por lo tanto, se tiene una expresión funcional de la forma: Ujp = Vjp + εjp. Según una de las principales referencias bibliográficas sobre modelización de transporte (Ortúzar, J.D., y Willumsen, L. G. (2011)), por un lado tenemos que: la elección del modo de transporte dentro de la red construida, representa el elemen- to más importante en la planificación de los transportes y en la toma de decisiones; tanto para modelos de pasajeros como de mercanćıas, es la etapa crucial de cara a las proyecciones a futuro; influye en la eficiencia general del sistema de transportes, en la cantidad de espacio urbano dedicado a las funciones del transporte, aśı como en el conjunto de alternativas disponibles; Además, se tiene que la probabilidad de que los individuos elijan una determi- nada alternativa es función de sus caracteŕısticas socioeconómicas y de la relativa atractividad de la alternativa. Para representar la atractividad de la alternativa se utiliza el concepto de utilidad (éste es un artificio teórico convenientemente definido en forma tautológica como lo que el individuo intenta maximizar). Las alternati- vas per se no producen utilidad, sino que la utilidad se deriva, Lancaster, (1966), de las caracteŕısticas de las alternativas y de las caracteŕısticas de los individuos. La utilidad medible u observable se define generalmente como una combinación li- neal de variables. Hay que comparar el valor de las utilidades de cada alternativa Caṕıtulo 3. Modelos de transporte 95 y transformarlos en un valor de probabilidad entre 0 y 1, utilizando habitualmente transformaciones matemáticas entre las que destacan los modelos Logit y Probit. Logit: P1 = exp (V1) exp (V1) + exp (V2) Probit: P1 = ∫ ∞ −∞ ∫ V1−V2+x1 −∞ exp { − 1 2(1−ρ2) [( x1 σ1 )2 − 2ρx1x2 σ1σ2 + ( x2 σ2 )2 ]} 2πσ1σ2 √ (1− ρ2) dx2dx1 Siendo los más utilizados de estos los siguientes: Multinomial Logit (MNL) (Ortúzar, J.D., y Willumsen, L. G. (2011)): Piq = exp(βViq)∑ Aj∈A(q) exp (βVjq) Hierarchical Logit (HL), o Modelo Logit Anidados (Williams, (1977); Daly y Zachary, (1978)): P (d,m) = exp {β (Vd + V ∗d )} exp(λVdm)∑ d′ exp { β ( Vd′ + V ∗ d′ )}∑ m′ exp {λVd′m′} con V ∗d = ( 1 λ ) log ∑ m∗ exp (λVdm∗) En opinión de Ortúzar y Willumsen, (2011): “Toda esta teoŕıa se basa en la hipótesis de que la unidad de decisión, el viajero IDEAL, es racional, egóısta, y sus gustos NUNCA cambian. Maximizando su utilidad mediante análisis cuidadosos y reflexivos.”; “Sin embargo, el viajero REAL, es parcialmente racional, pero también es emocional y colaborador. No puede usar TODAS las alternativas, por lo que usa reglas heuŕısticas para decidir: Le importan más los cambios que los valores absolutos; Tiene una sensibilidad decreciente a los cambios de utilidad (5 minutos Caṕıtulo 3. Modelos de transporte 96 son importantes en un viaje de 30 pero no en uno de 3 horas); Es enemigo de las pérdidas; No reacciona inmediatamente”. Dicho esto, dado el grado de incertidumbre y la información a priori en la toma de decisiones por parte de la unidad de decisión (en base a recuerdos y experiencias pasadas), por qué no plantear otro tipo de modelos para analizar la elección de alternativas?, más allá de modelos Logit Multinomiales (MNL) o Logit Jerárquicos (HL). ¿Por qué no optimizar la etapa de reparto modal utilizando Redes Bayesianas?, dados los buenos resultados de las mismas en los últimos años en diferentes trabajos de investigación (utilizando una gran cantidad de variables), y dada la relevancia de esta etapa en los modelos de transporte. 3.4.1. Multinomial Logit (MNL) Este modelo formula la probabilidad de que una unidad de transporte elija una alternativa dada de un conjunto de posibles alternativas. Esta probabilidad viene dada por: Pn(i) = prob(Y n) = eVni∑ jεCn eVnj , donde: Pn(i) es la probabilidad con la que el individuo n elije la alternativa i. Yn es el valor de la variable respuesta del individuo n. Cn es el conjunto de alternativas de n. Vni es la componente medible de la utilidad de la alternativa i para el individuo n. Vnj es la componente medible de la utilidad de la alternativa j para el individuo n. En este caso el individuo es cada unidad de carga, mientras que el conjunto de alternativas está formado por dos elementos de transporte: multimodal y carretera. La unidad de decisión evalúa la función de utilidad de cada alternativa a la que se enfrenta y elije la alternativa con mayor valor de utilidad. Mientras la función de utilidad no se conozca con certeza, ésta es especificada con un término de error aleatorio. Caṕıtulo 3. Modelos de transporte 97 En particular, el MNL para las probabilidades de elección surge si se asume que la utilidad de una alternativa es una función de factores determinantes de la elección de algunos parámetros desconocidos y de la suma de un término de error que sigue una distribución Gumbel. Es esta suposición (que todos los términos de error tengan distribuciones Gumbel y sean estad́ısticamente independientes) es lo que hace a la formulación del modelo tratable, quedando expresada la utilidad como sigue, tal que la función de utilidad es lineal con respecto al vector de parámetros βt: Unj = βtXnj + εnjjεCn, donde: Unj es la utilidad de la alternativa j para el individuo n. Xnj es el vector de variables explicativas para la alternativa j para el individuo n. εnj es el término de error independiente y distribuido Gumbel. Cn es el conjunto de elecciones para el individuo n. βt es el parámetro del modelo. Además, multiplicando el numerador y el denominador de la ecuación MNL por la cantidad e(−V nm) donde Vnm es la utilidad medible de una alternativa arbitraria m de un individuo n, se obtiene la siguiente expresión: Pn(i) = e(V ni−Vnm ) 1+ ∑ j 6=m e(Vnj−Vnm) , ∀i, jεCn. Los MNL se especifican definiendo la utilidad relativa de cada una de las posibles alternativas. Esto implica la definición de las variables explicativas que entran en cada función de utilidad y la relación de los parámetros dentro de la función. Estas variables pueden ser de varios tipos: caracteŕısticas del elemento decisor, que en este caso es el viaje de carga (por ejemplo, el tiempo o el coste de cada viaje) o atributos espećıficos de cada alternativa (por ejemplo, el tamaño de los veh́ıculos usados en un modo). Otra distinción de estas variables a considerar se da entre genéricas y espećıficas. Las genéricas son aquellas que tiene el mismo efecto, es decir el mismo valor del parámetro, mientras que las espećıficas tienen diferentes efectos en cada alternativa. Caṕıtulo 3. Modelos de transporte 98 En el caso que nos ocupa del presente estudio, los modelos MNL se han aplicado para estimar la probabilidad de que un cargador opte por un medio de transporte u otro en función de la naturaleza de la carga, de las alternativas existentes y de los costes y tiempos asociados a cada alternativa. Por ello, las variables genéricas del modelo son Tiempo y Coste, debido a que generan los mismos efectos mientras que la variable Constante que aparece en la función de utilidad de carretera es espećıfica de este medio de transporte. En este tipo de métodos las probabilidades de elección vaŕıan entre 0 y 1, y la suma de probabilidades de diferentes medios para una unidad de decisión debe ser igual a 1. 3.4.2. Redes Neuronales (RN) Otra aproximación considerada fue el uso de RN para la elección modal, que es una técnica prometedora para los modelos de elección modal (Hensher and Ton, (2000); Karlaftis and Vlahogianni, (2011); Nijkamp et al., (2004)). Las redes neuro- nales pueden ajustarse a datos no lineales complejos (Karlaftis y Vlahogianni, (2011), pese a que en general requieren grandes conjuntos de datos, pueden estar sujetas a sobreajustes y los parámetros del modelo no tienen una interpretación directa. Se descartaron en esta memoria porque el tamaño de los conjuntos de datos disponi- bles era limitado y se deseaba proporcionar una interpretación de los parámetros del modelo. Las redes neuronales (RN) son estructuras matemáticas, igual que las RB, que permiten representar funciones con varias variables de entrada y de salida inspira- das en el comportamiento de las neuronas, proporcionando un modelo flexible para representar múltiples funciones de elección modal. Pueden ser de una capa o multi- capa. En las RN a las neuronas artificiales se les aplica un conjunto de entradas, mul- tiplicadas por una ponderación equivalente al grado de conexión de la sinapsis. De cada una resulta una salida de otra neurona Posteriormente, las entradas (pondera- das) se suman y se cuantifica el grado de activación de la neurona. La salida neuronal Y está dada por: Caṕıtulo 3. Modelos de transporte 99 Y = f( n∑ i=1 (wixi)), tal que: 1. la salida neuronal es Y 2. el conjunto de entradas viene dado por x1, . . . , xn 3. las ponderaciones de cada entrada son w1, . . . wn. 4. La función de agregación Σ 5. La función de activación f, pudiendo ser ésta una función lineal o no lineal, umbral, que sirve para replicar las transferencias no lineales de las neuronas. Teorema de Convergencia (Lippman, 1987). Sean X(n)={x1(n), x2(n),. . . }las entradas de datos que representan muestras de dos clases linealmente separables, C1 y C2. Sea w un vector tal que wTx > 0 si xεC1 wTx ≤ 0 si xεC2 Sea H1 el subconjunto de entrenamiento que pertenecen a la clase C1. Sea H2 el subconjunto de entrenamiento que pertenecen a la clase C2. Entonces, si H es un conjunto de entrenamiento linealmente separable, entonces para η positivo, el algoritmo termina (converge). Es decir, el Perceptrón divide al hiperplano en dos clases siempre y cuando estas sean linealmente separables, tal y como se describe a continuación. Consideremos el modelo de perceptrón de una capa descrito en la Figura 3.7. Sea θ (n) el umbral considerado, equivalente al peso sináptico conectado a una entrada fija e igual a -1. Definimos el vector de entrada como: x (n) = [−1,x1 (n) , x2 (n) , . . . ,xp (n)]T , Caṕıtulo 3. Modelos de transporte 100 Figura 3.7: Modelo del perceptrón simple con una entrada fija (arriba). Red neuronal multicapa. Fuente: Ramı́rez, J.A. (abajo) Caṕıtulo 3. Modelos de transporte 101 y el vector de pesos como: w (n) =[θ (n) , w1 (n) , w2 (n) , . . . ,wP (n)]T . Entonces, la salida de la combinación lineal es: v (n) = wT (n) x (n) Para un n fijo, la ecuación de un hiperplano como superficie de decisión de dos clases es wTx= 0, representada en un espacio p-dimensional con coordenadas x1, x2, . . . ,xp. Suponemos que las variables de entrada generan dos clases linealmente separa- bles por un hiperplano, tal que X1 es el subconjunto de vectores de entrenamiento x1 (1) , x1 (2) , . . . que pertenecen a la clase C1 , y X2 es el subconjunto de vectores de entrenamiento x2 (1) , x2 (2) , . . . que pertenecen a la clase C2. Dados X1 y X2 para entrenar al clasificador, se ajusta el vector de pesos w de forma que las dos clases C1 y C2 sean separables. Si existe un w factible entonces las dos clases son linealmente separables. E inversamente, si se sabe que las dos clases son linealmente separables, entonces existe un vector de pesos w tal que cumple con las siguientes expresiones: wT (n)x (n)> 0 para cada vector de entrada x que pertenezca a la clase C1 wT (n)x (n) ≤ 0 para cada vector de entrada x que pertenezca a la clase C2 Teorema de Convergencia de incremento finito. Sean los subconjuntos de en- trenamiento X1 y X2 linealmente separables y las entradas presentadas al perceptrón las originadas por estos subconjuntos. El perceptrón converge tras n0 iteraciones, tal que: w (no) = w (no+ 1) = w (no+ 2) = . . . es un vector solución para n0 ≤ nmax. Además, se sabe por el Teorema de Novikoff (1962) que no importa lo pe- queño que la distancia de separación de la muestral de datos, si ésta es linealmente Caṕıtulo 3. Modelos de transporte 102 separable, entonces el preceptrón encontrará una solución que separa a las dos clases en un número finito de pasos. El número de iteraciones (tiempos de replicación) dependerá de la distancia de separación y es inversamente proporcional al cuadrado de la distancia. En el caso de las Redes Neuronales Multicapa, tienen una capa de entrada a la red con su conjunto de neuronas, un número finito de capas ocultas y el conjunto de neuronas de la capa de salida de la red. Su uso en este caso consiste en estimar las probabilidades de reparto entre alter- nativas en función de un conjunto de factores de coste y tiempo. Representan una aproximación de “caja negra” en la que el analista no necesita preocuparse de los detalles internos de cómo funciona la red, aunque debido a esto se pierde capacidad para: 1. Interpretar los resultados del ajuste. 2. Validar si el modelo se comporta de forma razonable. Una interesante comparación entre RN y modelos Logit es dada por Karlaftis y Vlahogianni, (2011). Estos autores comparan los diferentes términos utilizados en cada aproximación, sus analoǵıas y sus diferencias. En general, las RN están más cerca del campo de la Inteligencia Computacional (CI) o Inteligencia Artificial (IA), que del campo de la Estad́ıstica. Una diferencia clave entre ambos enfoques es que las RN actúan como una çaja negra”que no se basa en ningún supuesto sobre la distribución estad́ıstica de las variables y que los parámetros del modelo no tienen una interpretación directa, como lo hacen en los modelos Logit. Por otro lado, las RN proporcionan una gran flexibilidad y no están restringidas por los supuestos requeridos para los modelos Logit. Caṕıtulo 4 Caso de estudio: Corredor Ferroviario Bioceánico Central 4.1. Introducción Si bien los usuales modelos matemáticos tienen una larga trayectoria y una base sólida, como se ha explicado en caṕıtulos anteriores, a la hora de encontrar soluciones al problema de la elección discreta, existen otro tipo de aproximaciones diferentes a las frecuentistas que pueden dar lugar a mejores resultados, y este es el caso de las aproximaciones bayesianas, en concreto, del uso de las RB aplicado al caso de estudio del Corredor Ferroviario Bioceánico Central (CFBC) que une las costas del océano Atlántico y del océano Paćıfico en Sudamérica, atravesando los páıses de Brasil, Bolivia y Perú. 4.2. Objetivos 4.2.1. Objetivos generales Los objetivos generales que se han perseguido con este trabajo son: a.1) mejorar el proceso de decisión de viajeros y operadores de carga; a.2) optimizar los modelos de transporte utilizados en planificación; a.3) comprobar que la aplicación de las aproximaciones bayesianas en la etapa de reparto modal supone obtener mejores 103 Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 104 resultados; a.4) promover las redes bayesianas en entornos complejos que ya son una realidad como son los Sistemas Inteligentes de Transporte (ITS), los Sistemas Cooperativos (V2V, V2I, V2I2V, I2I) de transporte e infraestructuras, y los veh́ıculos autónomos. 4.2.2. Objetivos espećıficos Los objetivos espećıficos, por otro lado, se resumen en: b.1) conseguir mejores resultados con menor cantidad de información; b.2) disminuir los tiempos de proce- samiento para el reparto modal; b.3) mejorar el ajuste coste-beneficio derivado de las mejoras aportadas por las RB en los resultados, cara a optimizar los recursos económicos existentes y conseguir financiación para los proyectos de infraestructura y transporte. En este caso hay que mencionar que el detalle de los costes de cada al- ternativa de transporte presentada está sujeto a confidencialidad. Sin embargo, en el siguiente enlace oficial se muestra la ficha descriptiva del proyecto correspondiente al COSIPLAN (Consejo Suramericano de Infraestructura y Planeamiento) de UNASUR (Unión de Naciones Suramericanas): http://www.iirsa.org/proyectos/detalle_ proyecto.aspx?h=1351. Comprobándose que es uno de los proyectos más impor- tantes del IIRSA (Iniciativa para la Integración de la Infraestructura Regional Sur- americana) con una inversión total de unos 7.000 millones de dólares; b.4) mejorar los resultados respecto a los algoritmos utilizados habitualmente. 4.3. Marco de actuación El modelo descrito se enmarca en el proyecto del Gobierno Plurinacional de Bo- livia, financiado por el Banco Interamericano de Desarrollo (BID) con número de préstamo BO-L1056-1, dirigido por el Viceministerio de Transporte (VMT) de Boli- via , a través de su Unidad Técnica Ferroviaria (UTF). Dicho proyecto se denomina “Estudio de Prospectiva Comercial, Mercado y Alternativas Loǵısticas del Corredor Ferroviario Bioceánico Central (CFBC)”. Como se ha indicado anteriormente, si bien Bolivia es el páıs responsable de este estudio, el ámbito del mismo incluye a más páıses del entorno, como son Brasil y Perú, directamente al ser páıses cuyas costas se pretende unir, además de otros páıses http://www.iirsa.org/proyectos/detalle_proyecto.aspx?h=1351 http://www.iirsa.org/proyectos/detalle_proyecto.aspx?h=1351 Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 105 Figura 4.1: Desconexión ferroviaria red oriental y red andina Figura 4.2: Propuesta de conexión con CFBC indirectamente, cuyas mercanćıas y pasajeros también podŕıan usar este corredor ferroviario, como son Paraguay, Argentina o Chile. La longitud total del corredor ferroviario es de 4.000 km en el que se tienen que rehabilitar algunos de los tramos existentes y construir algunos nuevos (ver desconexión ferroviaria entre la red oriental y la red andina en la imagen siguiente). Se pretende conectar las redes ferroviarias oriental y occidental de Bolivia, lo cual permitiŕıa un continuo en dicha red uniendo océano Atlántico y Paćıfico. Ambas redes bolivianas están separadas por la cordillera de los Andes y esta infraestructura busca conectar el altiplano andino occidental, a 4.000m de altura, y la zona oriental de Bolivia a unos 600m de altura, conectada a su vez a Brasil y Argentina. De esta forma se podrá configurar un corredor ferroviario de costa a costa de gran interés Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 106 social y productivo. Lo que busca es fomentar el desarrollo regional y un efecto integrador, además del intercambio comercial, principalmente entre Bolivia, Perú y Brasil. La nueva construcción se da en la parte central de Bolivia, ya que debido a su orograf́ıa la red existente está dividida en dos partes no conectadas, lo que hace que se pierda la conectividad entre ambas costas. Especialmente, es de suma importancia para las regiones más interiores de Su- damérica, ya que sus comunicaciones con los puertos más cercanos son lentas y costosas, y por ello constituyen un impedimento para el desarrollo económico de la región. El modelo se empleó para la evaluación de esta infraestructura, es decir, para establecer bajo qué condiciones este corredor va a ser capaz de captar un tráfico de mercanćıas y pasajeros tal, que haga que sea viable y rentable. Además, permitió el dimensionamiento del mismo, capacidades, veh́ıculos, etc., para alcanzar los objetivos de viabilidad y rentabilidad. El modelo desarrollado se empleó para dar forma al sistema existente y futuro y plantear los diferentes escenarios de simulación que proporcionaron los valores nece- sarios para los posteriores análisis. Aśı a continuación, a partir del modelo conceptual definido con anterioridad, se explicará cada una de etapas tenidas en cuenta y como se han llevado a cabo. Para la implementación del modelo se empleó la herramienta TransCAD. Este software integra un SIG junto a capacidades de modelización de transporte. Además, cuenta con un lenguaje propio denominado GISDK en el que se ha desarrollado el modelo para su ejecución iterativa, para diferentes periodos de tiempo y diferentes mercanćıas. La flexibilidad del modelo permite el establecimiento de tres niveles geográficos de análisis relacionados entre śı: mundial, nacional y regional. El trabajo descrito en esta memoria parte del modelo de transporte de cuatro etapas que se desarrolló en dicho proyecto por el equipo de expertos nacionales e internacionales, siendo responsable del mismo, para proporcionar estimaciones de los flujos de mercanćıa y pasajeros que harán uso de dicho corredor frente a las alternativas existentes. Para mercanćıa, los principales modos en competencia con el Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 107 Figura 4.3: Modelo de transportes (mundial) ferroviario, por agregación en la cadena de transporte, son la carretera y la hidrov́ıa Paraguay-Paraná. Una descripción completa puede leerse en Rios-Prado et al. (2013), si bien esta memoria se centra en la problemática del transporte de mercanćıas ya que es el de mayor interés para el CFBC. Tomando el esquema general, explicado en el modelo conceptual, la Figura 3.4 representa los pasos que se llevaron a cabo en la creación del modelo de transportes del CFBC y la siguiente figura muestra el ámbito mundial modelizado a tales efectos. 4.4. Metodoloǵıa Recoger todas las citas y documentación consultada es prácticamente imposible, por lo que mencionar a modo de muestra los trabajos recientes de Sun et al. (2006), Correa et al. (2009), Tang et al. (2012), aplicando RB a modelos de transporte de veh́ıculo privado y pasajeros, Daziano et al. (2013), donde están contenidas las RB asociadas a la distribución multinomial, Yannis Tyrinopoulos (2013) y Tai Yu Ma (2015) donde pueden verse distribuciones más generales aplicadas a este tipo de redes. Sin embargo, todos ellos se focalizan en ámbitos de estudio urbanos o metro- Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 108 politanos y de veh́ıculo privado, bien para analizar temas como; la seguridad vial, considerando los beneficios derivados del uso de modelos Markov Chain Monte Carlo (MCMC) y de los modelos bayesianos Empirical Bayes (EB) y Full Hierarchical Ba- yes (FHB); la movilidad en situaciones de congestión vehicular, con modelos Probit; o los patrones de movilidad urbana de los trabajadores (commuters y similares) de zonas frontera metropolitanas, analizando cuáles son las principales variables que influyen en un modelo de reparto modal orientado a la promoción del transporte público en detrimento del veh́ıculo privado. Por tanto, bajo esta consideración, si bien son similares en cuando a la orientación de la elección modal, difieren en cuanto a su uso hacia un modelo de transporte de mercanćıas como el indicado en el caso de estudio que se presenta, el cual además es un caso real. La metodoloǵıa utilizada responde a las siguientes preguntas clave del desarrollo del trabajo. ¿Cuáles son las contribuciones originales? A la vista de la base teórica explicada en los caṕıtulos anteriores sobre Redes Bayesianas y Modelos de Transporte, la principal novedad reside en el uso de las redes bayesianas en la etapa de reparto modal de un modelo de transportes (de cuatro etapas) de mercanćıas, multimodal, a nivel mundial, confirmando que los resultados obtenidos son mejores que los obtenidos con otras técnicas más habituales, como los modelos multinomial logit (MNL) y las redes neuronales (RN). ¿Cuál es su naturaleza? La definición de la temática y el planteamiento del pro- blema de investigación centran el estudio en la planificación de las infraestucturas a futuro. En este caso concreto, de una infraestructura multimodal con relaciones a todos los niveles posibles: distritales, regionales, estatales y continentales. El desa- rrollo de la perspectiva teórica se basa en las Redes Bayesianas, en la definición, tipoloǵıa y aplicación de las mismas, considerando sus principales caracteŕısticas y propiedades. La recolección, análisis e interpretación de los datos toma de referen- cia un caso práctico de studio, un corredor ferroviario que una el océano Atlántico con el océano Paćıfico, prioritariamente para el transporte de mercanćıas. Siendo las variables principales en la elección de las alternativas de transporte multimodal las de tiempo y coste, la naturaleza de la investigación es meramente cuantitativa. Si bien, la posibilidad de incluir otro tipo de variables cualitativas hace más extensa Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 109 esta naturaleza inicial. La estrategia metodológica se basa en la comparativa de los resultados obtenidos para las distintas alternativas de transporte, en cuanto a la elección del modo de transporte (reparto modal), en el modelo de transportes cons- truido a tal efecto. Las metas del estudio, finalmente, han sido las de comprobar que los resultados obtenidos con las redes bayesianas son mejores que las obtenidas con otros métodos habituales, los multinomial logit (MNL) y las redes neuronales (RN). ¿Cuál es su alcance? El alcance del uso de las RB es: a) macroscópico, como es el caso de estudio presentado, pudiéndose aplicar de forma añadida tanto a la etapa (1) de generación-atracción, como a la etapa (2) de distribución de viajes (transfor- mada de la matriz de generación-atracción a la matriz de origen-destino mediante una función de impedancia). El siguiente paso, lógico, de la presente investigación precisamente va en ĺınea con la implementación de este tipo de redes bayesianas en tres de las cuatro etapas de un modelo de mercanćıas; b) microscópico, en los mode- los de tráfico de ámbito más urbano o interurbano, pudiéndose aplicar a los modelos de elección de ruta o seguimiento vehicular, inicialmente. ¿Cuáles son sus limitaciones? Hasta el momento: a) la inexistencia de proyectos similares de transporte de mercanćıas en el que se hayan podido replicar el uso de redes bayesianas al reparto modal, que verifiquen que los resultados obtenidos en este caso; b) la difusión de las redes bayesianas como herramientas de aplicación en los proyectos de planificación de infraestructura todav́ıa tiene un margen de penetración en las entidades públicas y empresas de ingenieŕıa, por lo que a d́ıa de hoy su uso no está muy extendido. Inicialmente, se opta por el empleo de un modelo de elección modal (MEM) o de reparto modal, que estima las proporciones de uso de las alternativas correspon- dientes a combinaciones de modo de transporte y puerto, empleando como factores los tiempos y costes de cada alternativa, el puerto maŕıtimo en cuestión, y ajusta un modelo por cada tipo de mercanćıa. Como alternativa añadida se presenta una aproximación bayesiana al problema de la elección modal, que no ha sido considerada por autores previos en este tipo de problemas de modelización de transporte. La red bayesiana permite estimar las proporciones de uso de las alternativas por sus tiempos y costes y añadiendo también la variable precio FOB (free On Board) del producto. En el modelo MEM no se usa Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 110 Figura 4.4: Esquema relacional del modelo de transportes el precio FOB del producto, sino que se ajusta un modelo independiente para cada producto. El precio FOB es el valor de la mercanćıa a bordo de un transporte maŕıtimo, el cual incluye: costo de la mercanćıa en el páıs de origen, transporte de los bienes y derechos de exportación. Este valor está relacionado con el uso del Incoterm FOB. El Incoterm Free On Board (FOB), que se traduce como ‘franco a bordo’se utiliza exclusivamente para transporte maŕıtimo o fluvial, tal que a efectos comerciales internacionales: 1. El vendedor entrega la mercanćıa en el puerto de embarque y asume los costos de trámites aduaneros de exportación y licencias de exportación. 2. El comprador realiza los trámites de importación, consigue el transporte desde el puerto de embarque y asume los costos durante la entrega de la mercanćıa (descarga, flete, despacho, etc.) En la Figura 4.4 se muestra el esquema relacional del modelo de transportes Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 111 construido sobre el que se aplicará la aproximación bayesiana al modelo de reparto o elección modal. 4.5. Base de datos Para realizar el ajuste de los modelos de elección, se partió de la mayor muestra disponible que permite estimar la distribución geográfica de los movimientos de car- ga en Bolivia, que es la base de datos del Instituto Nacional de Estad́ıstica (INE) boliviano para Comercio Exterior. Dicha base de datos contiene registros de exportaciones e importaciones identifi- cando las siguientes variables: 1. Productos agrupados por diversas categoŕıas (se han empleado las categoŕıas de sección NANDICA de cuatro d́ıgitos y la clasificación de principales productos). 2. Departamento de origen o destino. 3. Páıs de origen o destino de importación o exportación. 4. Vı́a de salida, que permite identificar a través de qué puerto se env́ıa la carga en aquellos env́ıos a destinos internacionales de larga distancia. 5. Modo de salida, que permite identificar si se está empleando carretera, ferro- carril o hidrov́ıa. Esta información en conjunto con el modelo de costes y tiempos, obtenidos de la información oficial disponible en el Viceministerio de Transporte de operadores de transporte y carga bolivianos, implementado con el software de modelización ma- croscópica TransCAD (Caliper Corp., www.caliper.com), permite analizar los modos de salida adoptados en relación con los costes y tiempos que implica cada opción. Para ello se combinaron tablas de importaciones y exportaciones descargadas del INE boliviano con las matrices OD de costes y tiempos obtenidas con el modelo de transporte. La tabla de datos de exportaciones empleada para el ajuste de los modelos de elección contiene un total de 466 registros y la de importaciones 4.333. Los principales datos de entrada al modelo se resumen en: Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 112 1. Cartograf́ıa oficial del VMT de la red de transporte considerando los modos de transporte carretera, ferrocarril, mar e hidrov́ıa Paraguay-Paraná. Esto permite construir el grafo de arcos y nodos de la red. 2. Bases de datos del Instituto Nacional de Estad́ıstica de Bolivia (INE). 3. Producciones agŕıcolas, la superficie cultivada y la productividad del terreno desde 1990 hasta 2011. 4. Producciones mineras en el mismo periodo. 5. Exportaciones e importaciones, para el periodo 2003-2012. 6. Índices de volumen f́ısico de producción y cantidad de transporte. 7. Producciones y consumos de los productos generales. Basado en informes sec- toriales, de productores y variables socioeconómicas. 8. Estimaciones de capacidades futuras, reservas minerales existentes y extensio- nes agŕıcolas. 9. Informes sectoriales y de encuestas. 10. Proyecciones económicas de la OCDE y organismos internacionales. 4.6. Alternativas de elección El problema de elección modal en este caso de estudio considera como alternativas de transporte las combinaciones de puertos de importación/exportación, junto con los modos de transporte hasta el puerto. No todas las combinaciones entre opciones son viables en la práctica, por lo que un primer paso consistió en identificar las combinaciones de alternativas factibles. Las condiciones de partida respecto de las alternativas de transporte disponible son: las opciones relativas al uso de la hidrov́ıa se integran con el modo maŕıtimo, de esta manera no se hace distinción entre puertos fluviales y maŕıtimos; no todos los tipos de mercanćıa hacen uso de todos los puertos. Como alternativas de transporte Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 113 Cuadro 4.1: Alternativas disponibles en el modelo (C=carretera, MM=multimodal carretera/tren). * Esta alternativa no está disponible en la actualidad, sino que será fruto de la construcción del CFBC. Alternativas Puerto Modo Graneles Contenedores Arica C Śı Śı Arica MM No No Ilo C Śı Śı Ilo MM * Śı Śı Iquique C Śı Śı Antofagasta C Śı No Antofagasta MM Śı No Pto. Busch C Śı Śı Pto. Busch MM Śı Śı Pto. Suarez C Śı Śı Pto. Suarez MM Śı Śı Buenos Aires C Śı Śı Santos C Śı Śı Santos MM Śı Śı para el modelo de elección se consideran los pares de puerto/modo siendo los modos sólo carretera y multimodal carretera / ferrocarril. La Tabla 4.1 muestra las alternativas disponibles, combinación de puerto y modo, para las mercanćıas de tipo graneles y para la mercanćıa contenerizada. 4.7. Ficheros principales de datos y estructura La información de partida se almacena, depura, valida y normaliza para su poste- rior tratamiento en cada uno de los modelos considerados: Multi Nomial Logit, Red Neuronal y Red Bayesiana. Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 114 ID SE N TI D O M ER CA N CI A ID 1 ID 2 Pr ec io F O B TO TA L TN / A ño 1 EX P Co nt en ed or iz 17 73 6 17 57 0 7, 66 21 94 43 37 7. 90 8, 0 2 EX P Co nt en ed or iz 17 73 6 17 57 1 3, 10 35 28 81 4. 00 4. 93 8, 9 3 EX P Co nt en ed or iz 17 73 6 17 57 2 1, 48 89 89 19 1. 14 9. 54 7, 1 A N TO FA G A ST A _C A RR ET ER A A N TO FA G A ST A _F ER RO VI A RI A A RI CA _C A RR ET ER A A RI CA _F ER RO VI A RI A IL O _C A RR ET ER A IQ U IQ U E_ CA RR ET ER A IQ U IQ U E_ FE RR O VI A RI A N U EV A PA LM IR A _C A RR ET ER A PT O SU A RE Z_ CA RR ET ER A PT O SU A RE Z_ FE RR O VI A RI A SA N TO S_ CA RR ET ER A SA N TO S_ FE RR O VI A RI A 0, 0 0, 0 37 7. 90 8, 0 0, 0 0, 0 0, 0 0, 0 0, 0 0, 0 0, 0 0, 0 0, 0 0, 0 0, 0 3. 93 0. 88 9, 2 0, 0 0, 0 74 .0 49 ,7 0, 0 0, 0 0, 0 0, 0 0, 0 0, 0 0, 0 0, 0 1. 12 7. 13 2, 1 0, 0 0, 0 22 .4 15 ,0 0, 0 0, 0 0, 0 0, 0 0, 0 0, 0 TO TA L D E TO N T ra ns po rt ad as AN TO FA G AS TA _C AR RE TE RA AN TO FA G AS TA _F ER RO VI AR IA AR IC A_ CA RR ET ER A AR IC A_ FE RR O VI AR IA IL O _C AR RE TE RA IQ U IQ U E_ CA RR ET ER A IQ U IQ U E_ FE RR O VI AR IA N U EV AP AL M IR A_ CA RR ET ER A PT O SU AR EZ _C AR RE TE RA PT O SU AR EZ _F ER RO VI AR IA SA N TO S_ CA RR ET ER A SA N TO S_ FE RR O VI AR IA 0, 00 % 0, 00 % 10 0, 00 % 0, 00 % 0, 00 % 0, 00 % 0, 00 % 0, 00 % 0, 00 % 0, 00 % 0, 00 % 0, 00 % 0, 00 % 0, 00 % 98 ,1 5% 0, 00 % 0, 00 % 1, 85 % 0, 00 % 0, 00 % 0, 00 % 0, 00 % 0, 00 % 0, 00 % 0, 00 % 0, 00 % 98 ,0 5% 0, 00 % 0, 00 % 1, 95 % 0, 00 % 0, 00 % 0, 00 % 0, 00 % 0, 00 % 0, 00 % % d e el ec ci ón T_ AR IC A_ CA RR ET ER A T_ IQ U IQ U E_ CA RR ET ER A T_ PT O SU AR EZ _C AR RE TE RA T_ IL O _C AR RE TE RA T_ N U EV AP AL M IR A_ CA RR ET ER A T_ SA N TO S_ CA RR ET ER A T_ AN TO FA G AS TA _C AR RE TE RA T_ AR IC A_ FE RR O VI AR IA T_ IQ U IQ U E_ FE RR O VI AR IA T_ PT O SU AR EZ _F ER RO VI AR IA T_ IL O _F ER RO VI AR IA T_ N U EV AP AL M IR A_ FE RR O VI AR IA T_ SA N TO S_ FE RR O VI AR IA T_ AN TO FA G AS TA _F ER RO VI AR IA 1. 05 4 1. 08 0 1. 01 0 1. 06 9 1. 27 0 1. 17 8 1. 12 3 93 5 96 2 1. 13 6 95 1 1. 14 0 1. 00 2 98 7 97 6 1. 00 3 92 8 99 2 1. 18 8 1. 09 7 1. 04 5 85 8 88 5 1. 05 4 87 4 1. 05 9 92 0 90 9 89 5 92 1 98 5 91 0 1. 24 4 1. 15 3 96 4 77 6 80 3 1. 11 1 79 2 1. 11 5 97 7 82 8 Ti em po V ia je (H or as ) CO ST _A RIC A_ CA RR ET ER A CO ST _IQ UI QU E_ CA RR ET ER A CO ST _P TO SU AR EZ _C AR RE TE RA CO ST _IL O_ CA RR ET ER A CO ST _N UE VA PA LM IRA _C AR RE TE RA CO ST _S AN TO S_ CA RR ET ER A CO ST _A NT OF AG AS TA _C AR RE TE RA CO ST _A RIC A_ FE RR OV IA RIA CO ST _IQ UI QU E_ FE RR OV IA RIA CO ST _P TO SU AR EZ _F ER RO VIA RIA CO ST _IL O_ FE RR OV IA RIA CO ST _N UE VA PA LM IRA _F ER RO VIA RIA CO ST _S AN TO S_ FE RR OV IA RIA CO ST _A NT OF AG AS TA _F ER RO VIA RIA 26 8 27 7 34 7 27 9 39 6 34 4 30 5 26 8 27 7 33 6 27 9 41 4 32 6 30 7 22 7 23 5 30 3 23 7 35 2 30 0 26 4 22 6 23 5 29 2 23 7 37 0 28 2 26 6 18 2 19 1 33 3 19 3 38 2 33 1 22 0 18 2 19 1 32 3 19 3 40 0 31 3 22 2 Co ste ($ /to n) M IN T ie m po M IN C os te 93 5, 21 26 8, 15 85 8, 02 22 6, 47 77 6, 21 18 2, 29 T _ A R IC A _ C A RT _ IQ U IQ U E _ CT _ P T O SU A R E T _ IL O _ C A R R ET _ N U E V A P A LT _ SA N T O S_ C T _ A N T O FA G AT _ A R IC A _ FE RT _ IQ U IQ U E _ FT _ P T O SU A R E T _ IL O _ FE R R O T _ N U E V A P A LT _ SA N T O S_ F T _ A N T O FA G A 1 1 8 1 4 5 7 5 1 3 4 3 3 5 2 4 3 1 8 7 0 2 7 2 0 1 1 5 2 0 5 6 7 5 1 1 1 8 1 4 5 7 0 1 3 4 3 3 0 2 3 9 1 8 7 0 2 7 1 9 6 1 5 2 0 1 6 2 5 1 1 1 8 1 4 5 2 0 9 1 3 4 4 6 8 3 7 7 1 8 7 0 2 7 3 3 4 1 5 3 3 9 2 0 0 5 1 T ie m p o V ia je ( H o ra s) C O ST _ A R IC A _C O ST _ IQ U IQ UC O ST _ P T O SU C O ST _ IL O _ C AC O ST _ N U E V AC O ST _ SA N T O C O ST _ A N T O F C O ST _ A R IC A _C O ST _ IQ U IQ C O ST _ P T O SU C O ST _ IL O _ FE C O ST _ N U E V AC O ST _ SA N T O C O ST _ A N T O F 0 9 7 9 1 1 1 2 8 7 6 3 7 0 9 6 8 1 1 1 4 6 5 8 3 9 0 9 7 6 1 1 1 2 5 7 4 3 7 0 9 6 6 1 1 1 4 3 5 6 3 9 0 9 1 5 1 1 1 2 0 0 1 4 8 3 7 0 9 1 4 0 1 1 2 1 8 1 3 0 3 9 C o st e ( $ /t o n ) F ig u ra 4. 5: H o ja E x ce l D A T A S E T E le cc io n M o d al Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 115 DIR FRE IGH T ID1 ID2 FO BPr ice MT PA T_A RIC A_C ART _IQ UIQ UE _CT _PT OS UA RET _IL O_ CA RRE T_N UE VA PAL T_S AN TO S_C T_A NT OF AG AT_ AR ICA _FE RT_ IQU IQU E_F T_P TO SUA RET _IL O_ FER ROT _N UE VA PAL T_S AN TO S_F T_A NT OF AG ACO ST_ AR ICA _CO ST_ IQU IQ CO ST_ PTO SU C OS T_I LO_ CAC OS T_N UE VAC OS T_S AN TOC OS T_A NT OFC OS T_A RIC A_C OS T_I QU IQ CO ST_ PTO SUC OS T_I LO_ FEC OS T_N UE VAC OS T_S AN TOC OS T_A NT OFA NT OF AG AST AN TO FAG AST AR ICA _CA RR AR ICA _FE RRO ILO _CA RRE TEI QU IQU E_C AIQ UIQ UE _FE RNU EVA PAL MP TO SUA REZ _PT OS UA REZ _SA NT OS _CA RSA NT OS _FE R 1E XP Con ten edo riz 177 36 175 70 7,6 621 944 3 377 .90 8,0 118 145 75 134 335 243 187 0 27 201 15 205 67 51 0 9 79 11 128 76 37 0 9 68 11 146 58 39 0 0 1 0 0 0 0 0 0 0 0 0 2E XP Con ten edo riz 177 36 175 71 3,1 035 288 1 4.0 04. 938 ,9 118 145 70 134 330 239 187 0 27 196 15 201 62 51 0 9 76 11 125 74 37 0 9 66 11 143 56 39 0 0 0,9 815 104 1 0 0 0,0 184 895 9 0 0 0 0 0 0 3E XP Con ten edo riz 177 36 175 72 1,4 889 891 9 1.1 49. 547 ,1 118 145 209 134 468 377 187 0 27 334 15 339 200 51 0 9 151 11 200 148 37 0 9 140 11 218 130 39 0 0 0,9 805 010 2 0 0 0,0 194 989 8 0 0 0 0 0 0 4E XP Con ten edo riz 177 36 175 74 1,4 883 208 3 5.2 00, 0 118 145 249 134 509 549 187 0 27 375 15 380 372 51 0 9 173 11 222 155 37 0 9 162 11 240 137 39 0 0 1 0 0 0 0 0 0 0 0 0 5E XP Con ten edo riz 177 36 175 75 0,7 812 083 9 12. 011 .79 8,5 118 145 9 134 269 177 187 0 27 135 15 139 1 51 0 9 129 11 178 127 37 0 9 119 11 196 108 39 0 0 0,0 515 471 1 0 0,9 484 528 9 0 0 0 0 0 0 0 6E XP Con ten edo riz 177 36 175 76 8,9 590 819 8 212 .00 0,0 172 199 8 187 268 176 241 54 80 134 69 139 0 105 7 16 20 17 69 18 44 7 16 10 17 88 0 46 0 0 1 0 0 0 0 0 0 0 0 0 7E XP Con ten edo riz 177 36 175 77 1,8 895 379 8 168 .67 4,0 118 145 249 134 509 555 187 0 27 375 15 380 378 51 0 9 173 11 222 245 37 0 9 162 11 240 226 39 0 0 1 0 0 0 0 0 0 0 0 0 8E XP Con ten edo riz 177 36 175 79 2,8 182 059 9 61. 021 ,3 118 145 61 134 320 280 187 0 27 186 15 191 103 51 0 9 71 11 120 96 37 0 9 60 11 138 78 39 0 0 0,1 311 182 4 0 0 0,8 688 817 6 0 0 0 0 0 0 9E XP Con ten edo riz 177 36 175 80 0,6 669 008 2.7 25. 680 ,0 118 145 61 134 320 280 187 0 27 186 15 191 103 51 0 9 71 11 120 96 37 0 9 60 11 138 78 39 0 0 1 0 0 0 0 0 0 0 0 0 10 EXP Con ten edo riz 177 36 175 81 1,1 716 981 4 14. 244 .56 3,3 118 145 61 134 320 280 187 0 27 186 15 191 103 51 0 9 71 11 120 96 37 0 9 60 11 138 78 39 0 0 0,8 717 941 7 0 0 0,1 282 058 3 0 0 0 0 0 0 11 EXP Con ten edo riz 177 36 175 82 0,2 268 363 4 3.8 99. 465 ,0 118 145 61 134 320 280 187 0 27 186 15 191 103 51 0 9 71 11 120 96 37 0 9 60 11 138 78 39 0 0 0,9 885 951 0 0 0,0 114 049 0 0 0 0 0 0 12 EXP Con ten edo riz 177 36 175 83 0,9 421 309 21. 864 ,0 256 283 0 272 260 219 325 138 165 126 154 130 42 189 47 56 10 58 59 35 84 47 56 0 57 78 17 86 0 0 1 0 0 0 0 0 0 0 0 0 13 EXP Con ten edo riz 177 36 175 84 0,1 716 805 9 407 .00 0,0 256 283 0 272 260 219 325 138 165 126 154 130 42 189 47 56 10 58 59 35 84 47 56 0 57 78 17 86 0 0 1 0 0 0 0 0 0 0 0 0 14 EXP Con ten edo riz 177 36 175 85 1,1 630 753 8 26. 000 ,0 317 344 0 332 260 219 386 198 225 126 214 130 42 250 80 88 10 90 59 35 117 79 88 0 90 78 17 119 0 0 1 0 0 0 0 0 0 0 0 0 15 EXP Con ten edo riz 177 36 175 86 0,5 710 374 3 322 .63 0,2 347 374 8 362 268 176 416 228 255 134 244 139 0 280 15 24 20 26 69 18 52 15 24 10 26 88 0 54 0 0 1 0 0 0 0 0 0 0 0 0 16 EXP Con ten edo riz 177 36 175 87 1,5 168 976 8 385 .39 8,3 382 409 8 398 268 176 446 264 291 134 279 139 0 310 34 43 20 45 69 18 155 34 43 10 45 88 0 157 0 0 0,9 021 402 1 0 0 0 0 0,0 978 597 9 0 0 0 0 17 EXP Con ten edo riz 177 36 175 88 3,3 657 110 4 22. 386 .78 5,7 382 409 8 398 268 176 446 264 291 134 279 139 0 310 34 43 20 45 69 18 155 34 43 10 45 88 0 157 0 0 0,0 229 450 4 0 0,9 770 549 6 0 0 0 0 0 0 0 18 EXP Con ten edo riz 177 36 175 89 3,8 093 607 6 185 .33 4,2 347 374 8 362 268 176 416 228 255 134 244 139 0 280 15 24 20 26 69 18 52 15 24 10 26 88 0 54 0 0 1 0 0 0 0 0 0 0 0 0 19 EXP Con ten edo riz 177 36 175 90 2,9 300 949 2 7.7 08. 404 ,0 347 374 8 362 268 176 416 228 255 134 244 139 0 280 15 24 20 26 69 18 52 15 24 10 26 88 0 54 0 0 0,0 095 065 1 0 0,0 523 000 6 0 0 0,9 381 934 3 0 0 0 0 20 EXP Con ten edo riz 177 36 175 91 0,9 278 169 1 1.2 65. 936 ,0 347 374 8 362 268 176 416 228 255 134 244 139 0 280 15 24 20 26 69 18 52 15 24 10 26 88 0 54 0 0 1 0 0 0 0 0 0 0 0 0 21 EXP Con ten edo riz 177 36 175 92 1,0 523 618 1 2.4 37. 157 ,2 347 374 8 362 268 176 416 228 255 134 244 139 0 280 15 24 20 26 69 18 52 15 24 10 26 88 0 54 0 0 0,1 914 063 0 0 0 0 0,8 085 937 0 0 0 0 22 EXP Con ten edo riz 177 36 175 93 1,3 556 778 4 59. 144 ,0 347 374 8 362 268 176 416 228 255 134 244 139 0 280 15 24 20 26 69 18 52 15 24 10 26 88 0 54 0 0 1 0 0 0 0 0 0 0 0 0 23 EXP Con ten edo riz 177 36 175 94 1,9 739 149 1 16. 100 ,0 382 409 8 398 268 176 446 264 291 134 279 139 0 310 34 43 20 45 69 18 155 34 43 10 45 88 0 157 0 0 1 0 0 0 0 0 0 0 0 0 24 EXP Con ten edo riz 177 36 175 97 1,3 689 651 6 49. 563 ,0 347 374 8 362 268 176 416 228 255 134 244 139 0 280 15 24 20 26 69 18 52 15 24 10 26 88 0 54 0 0 1 0 0 0 0 0 0 0 0 0 25 EXP Con ten edo riz 177 37 175 80 0,1 189 952 4 581 .00 0,0 173 184 218 190 429 437 244 55 96 380 122 232 310 0 0 8 152 13 167 177 42 2 37 167 55 188 244 31 0 0 1 0 0 0 0 0 0 0 0 0 26 EXP Con ten edo riz 177 37 175 81 6,0 346 737 9 104 .29 0,0 173 184 218 190 429 437 244 55 96 380 122 232 310 0 0 8 152 13 167 177 42 2 37 167 55 188 244 31 0 0 1 0 0 0 0 0 0 0 0 0 27 EXP Con ten edo riz 177 37 175 90 7,1 879 912 5 125 .71 0,0 236 246 0 253 211 168 307 118 158 162 185 14 41 63 0 8 86 13 101 84 42 2 37 102 55 123 151 31 0 0 1 0 0 0 0 0 0 0 0 0 28 EXP Con ten edo riz 177 39 175 71 0,0 973 065 6 49. 008 ,0 200 203 203 217 366 348 223 76 96 393 143 242 269 0 7 0 123 21 105 105 16 9 25 164 61 181 209 18 0 0 1 0 0 0 0 0 0 0 0 0 29 EXP Con ten edo riz 177 39 175 81 1,3 354 572 64. 394 ,8 200 203 193 217 357 389 223 76 96 383 143 232 310 0 7 0 118 21 100 128 16 9 25 159 61 176 231 18 0 0 1 0 0 0 0 0 0 0 0 0 30 EXP Con ten edo riz 177 39 175 90 0,4 308 641 7 2.9 10. 430 ,0 287 291 0 304 164 145 311 163 183 190 231 39 66 88 7 0 53 21 34 35 16 8 25 93 61 110 138 18 0 0 0 0 0 0 0 1 0 0 0 0 31 EXP Con ten edo riz 177 43 175 71 2,6 459 423 1 937 .21 6,7 189 200 216 204 455 384 244 55 96 390 122 242 269 0 0 9 133 11 173 130 42 3 38 173 55 194 223 32 0 0 1 0 0 0 0 0 0 0 0 0 32 EXP Con ten edo riz 177 43 175 72 1,2 654 378 8 723 .95 1,0 189 200 354 204 593 522 244 55 96 528 122 380 407 0 0 9 207 11 247 205 42 3 38 248 55 269 297 32 0 0 1 0 0 0 0 0 0 0 0 0 33 EXP Con ten edo riz 177 43 175 76 0,4 306 903 6 93. 241 ,0 189 200 100 204 340 268 244 55 96 274 122 127 153 0 0 9 70 11 110 68 42 3 38 111 55 132 160 32 0 0 1 0 0 0 0 0 0 0 0 0 34 EXP Con ten edo riz 177 43 175 79 0,7 858 072 3 22. 286 ,0 189 200 206 204 445 425 244 55 96 380 122 232 310 0 0 9 127 11 168 153 42 3 38 168 55 189 245 32 0 0 1 0 0 0 0 0 0 0 0 0 35 EXP Con ten edo riz 177 43 175 80 0,1 282 093 609 .26 0,0 189 200 206 204 445 425 244 55 96 380 122 232 310 0 0 9 127 11 168 153 42 3 38 168 55 189 245 32 0 0 1 0 0 0 0 0 0 0 0 0 36 EXP Con ten edo riz 177 43 175 81 0,5 866 849 5 809 .71 5,0 189 200 206 204 445 425 244 55 96 380 122 232 310 0 0 9 127 11 168 153 42 3 38 168 55 189 245 32 0 0 1 0 0 0 0 0 0 0 0 0 37 EXP Con ten edo riz 177 43 175 82 0,0 728 894 5 127 .81 0,0 189 200 206 204 445 425 244 55 96 380 122 232 310 0 0 9 127 11 168 153 42 3 38 168 55 189 245 32 0 0 1 0 0 0 0 0 0 0 0 0 38 EXP Con ten edo riz 177 43 175 86 1,5 118 933 3 167 .75 7,0 264 274 0 279 239 168 319 130 171 174 197 26 53 75 0 9 62 11 102 59 42 3 38 103 55 124 152 32 0 0 1 0 0 0 0 0 0 0 0 0 39 EXP Con ten edo riz 177 43 175 87 1,5 534 788 1 27. 134 ,0 299 310 0 314 239 168 350 165 206 174 233 26 53 105 0 9 43 11 83 40 126 3 38 84 55 105 133 115 0 0 1 0 0 0 0 0 0 0 0 0 40 EXP Con ten edo riz 177 43 175 88 1,2 185 663 1 429 .22 0,0 299 310 0 314 239 168 350 165 206 174 233 26 53 105 0 9 43 11 83 40 126 3 38 84 55 105 133 115 0 0 1 0 0 0 0 0 0 0 0 0 41 EXP Con ten edo riz 177 43 175 89 3,9 262 79 6.2 94, 0 264 274 0 279 239 168 319 130 171 174 197 26 53 75 0 9 62 11 102 59 42 3 38 103 55 124 152 32 0 0 1 0 0 0 0 0 0 0 0 0 42 EXP Con ten edo riz 177 43 175 90 3,1 022 817 9 81. 048 ,9 264 274 0 279 239 168 319 130 171 174 197 26 53 75 0 9 62 11 102 59 42 3 38 103 55 124 152 32 0 0 1 0 0 0 0 0 0 0 0 0 43 EXP Con ten edo riz 177 43 175 91 0,9 647 842 9 962 .88 5,0 264 274 0 279 239 168 319 130 171 174 197 26 53 75 0 9 62 11 102 59 42 3 38 103 55 124 152 32 0 0 1 0 0 0 0 0 0 0 0 0 44 EXP Con ten edo riz 177 43 175 92 3,5 073 925 2 829 .08 5,2 264 274 0 279 239 168 319 130 171 174 197 26 53 75 0 9 62 11 102 59 42 3 38 103 55 124 152 32 0 0 1 0 0 0 0 0 0 0 0 0 45 EXP Con ten edo riz 177 43 175 95 1,4 972 563 8 46. 107 ,0 264 274 0 279 239 168 319 130 171 174 197 26 53 75 0 9 62 11 102 59 42 3 38 103 55 124 152 32 0 0 1 0 0 0 0 0 0 0 0 0 46 EXP Con ten edo riz 177 43 175 96 25, 517 600 6 547 ,1 264 274 0 279 239 168 319 130 171 174 197 26 53 75 0 9 62 11 102 59 42 3 38 103 55 124 152 32 0 0 1 0 0 0 0 0 0 0 0 0 47 EXP Con ten edo riz 177 45 175 71 1,1 744 014 9 427 .50 1,7 85 118 67 79 346 235 178 0 27 196 15 201 62 51 1 21 105 0 162 103 55 37 45 102 47 180 92 76 0 0 1 0 0 0 0 0 0 0 0 0 48 EXP Con ten edo riz 177 45 175 72 0,6 582 091 117 .60 0,0 85 118 205 79 484 373 178 0 27 334 15 339 200 51 1 21 180 0 237 178 55 37 45 177 47 255 167 76 0 0 1 0 0 0 0 0 0 0 0 0 49 EXP Con ten edo riz 177 45 175 81 0,3 727 185 7 76. 750 ,0 85 118 57 79 336 276 178 0 27 186 15 191 103 51 1 21 100 0 157 125 55 37 45 97 47 175 114 76 0 0 1 0 0 0 0 0 0 0 0 0 50 EXP Con ten edo riz 177 45 175 85 1,3 713 607 8 17. 516 ,5 287 320 0 281 279 219 380 202 229 129 217 134 46 253 44 64 3 43 60 28 98 79 88 0 90 78 17 119 0 0 1 0 0 0 0 0 0 0 0 0 51 EXP Con ten edo riz 177 45 175 86 1,4 866 338 4 73. 631 ,1 314 346 5 308 284 173 407 228 255 134 244 139 0 280 1 21 35 0 91 32 55 37 45 31 47 109 21 76 0 0 1 0 0 0 0 0 0 0 0 0 52 EXP Con ten edo riz 177 45 175 92 1,4 200 989 5 20. 613 ,8 314 346 5 308 284 173 407 228 255 134 244 139 0 280 1 21 35 0 91 32 55 37 45 31 47 109 21 76 0 0 1 0 0 0 0 0 0 0 0 0 53 EXP Con ten edo riz 177 48 175 70 0,8 682 287 7 112 .25 1,0 167 200 247 162 460 415 260 55 96 394 123 247 273 0 0 21 169 0 187 167 54 15 50 188 67 209 237 44 0 0 1 0 0 0 0 0 0 0 0 0 54 EXP Con ten edo riz 177 48 175 71 0,7 453 357 4 14. 170 .67 9,0 167 200 242 162 455 410 260 55 96 390 122 242 269 0 0 21 166 0 185 164 54 15 50 185 67 206 235 44 0 0 0,2 223 379 0 0,7 762 507 4 0,0 014 113 6 0 0 0 0 0 0 55 EXP Con ten edo riz 177 48 175 72 6,7 306 193 9 255 .50 9,2 167 200 380 162 593 549 260 55 96 528 123 380 407 0 0 21 241 0 259 239 54 15 50 260 67 281 309 44 0 0 1 0 0 0 0 0 0 0 0 0 56 EXP Con ten edo riz 177 48 175 74 1,2 602 924 4 99. 949 ,0 167 200 421 162 634 720 260 55 96 569 122 421 579 0 0 21 263 0 281 245 54 15 50 282 67 303 316 44 0 0 1 0 0 0 0 0 0 0 0 0 57 EXP Con ten edo riz 177 48 175 75 5,7 201 238 4 61. 696 ,6 167 200 181 162 394 349 260 55 96 328 122 181 207 0 0 21 219 0 238 217 54 15 50 238 67 259 288 44 0 0 0,9 175 481 3 0 0,0 824 518 7 0 0 0 0 0 0 0 58 EXP Con ten edo riz 177 48 175 76 35, 944 321 7 1.5 72. 813 ,8 167 200 127 162 340 295 260 55 96 274 122 127 153 0 0 21 104 0 122 102 54 15 50 123 67 144 172 44 0 0 1 0 0 0 0 0 0 0 0 0 59 EXP Con ten edo riz 177 48 175 77 11, 100 620 8 19. 909 ,0 167 200 421 162 634 727 260 55 96 569 123 421 585 0 0 21 263 0 281 335 54 15 50 282 67 303 405 44 0 0 0,6 850 168 3 0 0,3 149 831 7 0 0 0 0 0 0 0 60 EXP Con ten edo riz 177 48 175 79 1,9 792 291 5 52. 950 ,0 167 200 232 162 445 452 260 55 96 380 122 232 310 0 0 21 161 0 180 186 54 15 50 180 67 201 257 44 0 0 1 0 0 0 0 0 0 0 0 0 61 EXP Con ten edo riz 177 48 175 80 0,3 707 710 6 1.2 86. 254 ,0 167 200 232 162 445 452 260 55 96 380 122 232 310 0 0 21 161 0 180 186 54 15 50 180 67 201 257 44 0 0 1 0 0 0 0 0 0 0 0 0 62 EXP Con ten edo riz 177 48 175 81 0,8 175 187 9.1 25. 300 ,3 167 200 232 162 445 452 260 55 96 380 122 232 310 0 0 21 161 0 180 186 54 15 50 180 67 201 257 44 0 0 0,9 707 631 5 0 0 0,0 292 368 5 0 0 0 0 0 0 63 EXP Con ten edo riz 177 48 175 82 0,3 444 818 6 1.3 54. 996 ,0 167 200 232 162 445 452 260 55 96 380 122 232 310 0 0 21 161 0 180 186 54 15 50 180 67 201 257 44 0 0 1 0 0 0 0 0 0 0 0 0 64 EXP Con ten edo riz 177 48 175 84 4,3 160 065 5 134 .07 5,5 167 200 34 162 247 252 260 55 96 181 122 34 111 0 0 21 54 0 72 79 54 15 50 73 67 94 149 44 0 0 1 0 0 0 0 0 0 0 0 0 65 EXP Con ten edo riz 177 48 175 85 1,0 281 827 1 75. 486 ,0 194 226 0 188 213 219 287 81 122 148 149 0 77 27 0 21 21 0 40 46 54 15 50 40 67 61 117 44 0 0 1 0 0 0 0 0 0 0 0 0 F ig u ra 4. 6: E st ru ct u ra D A T A 1 Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 116 D IR D IR FR EI G H T FR EI G H T ID 1 ID 1 ID 2 ID 2 FO BP ric e FO BP ric e M TP A M TP A FO BP ric e+ M TP A T_ AR IC A_ CA RR ET ER A T1 FO BP ric e+ M TP A+ T1 T_ IQ U IQ U E_ CA RR ET ER A T2 FO BP ric e+ M TP A+ T1 +T 2 T_ PT O SU AR EZ _C AR RE TE RA T3 FO BP ric e+ M TP A+ T1 +T 2+ T3 T_ IL O _C AR RE TE RA T4 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4 T_ N U EV AP AL M IR A_ CA RR ET ER A T5 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 T_ SA N TO S_ CA RR ET ER A T6 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6 T_ AN TO FA G AS TA _C AR RE TE RA T7 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 T_ AR IC A_ FE RR O VI AR IA T8 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8 T_ IQ U IQ U E_ FE RR O VI AR IA T9 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 T_ PT O SU AR EZ _F ER RO VI AR IA T1 0 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 T_ IL O _F ER RO VI AR IA T1 1 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 +T 11 T_ N U EV AP AL M IR A_ FE RR O VI AR IA T1 2 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 +T 11 +T 12 T_ SA N TO S_ FE RR O VI AR IA T1 3 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 +T 11 +T 12 +T 13 T_ AN TO FA G AS TA _F ER RO VI AR IA T1 4 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 +T 11 +T 12 +T 13 +T 14 CO ST _A RI CA _C AR RE TE RA C1 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 +T 11 +T 12 +T 13 +T 14 +C 1 CO ST _I Q U IQ U E_ CA RR ET ER A C2 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 +T 11 +T 12 +T 13 +T 14 +C 1+ C2 CO ST _P TO SU AR EZ _C AR RE TE RA C3 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 +T 11 +T 12 +T 13 +T 14 +C 1+ C2 +C 3 CO ST _I LO _C AR RE TE RA C4 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 +T 11 +T 12 +T 13 +T 14 +C 1+ C2 +C 3+ C4 CO ST _N U EV AP AL M IR A_ CA RR ET ER A C5 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 +T 11 +T 12 +T 13 +T 14 +C 1+ C2 +C 3+ C4 +C 5 CO ST _S AN TO S_ CA RR ET ER A C6 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 +T 11 +T 12 +T 13 +T 14 +C 1+ C2 +C 3+ C4 +C 5+ C6 CO ST _A N TO FA G AS TA _C AR RE TE RA C7 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 +T 11 +T 12 +T 13 +T 14 +C 1+ C2 +C 3+ C4 +C 5+ C6 +C 7 CO ST _A RI CA _F ER RO VI AR IA C8 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 +T 11 +T 12 +T 13 +T 14 +C 1+ C2 +C 3+ C4 +C 5+ C6 +C 7+ C8 CO ST _I Q U IQ U E_ FE RR O VI AR IA C9 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 +T 11 +T 12 +T 13 +T 14 +C 1+ C2 +C 3+ C4 +C 5+ C6 +C 7+ C8 +C 9 CO ST _P TO SU AR EZ _F ER RO VI AR IA C1 0 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 +T 11 +T 12 +T 13 +T 14 +C 1+ C2 +C 3+ C4 +C 5+ C6 +C 7+ C8 +C 9+ C1 0 CO ST _I LO _F ER RO VI AR IA C1 1 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 +T 11 +T 12 +T 13 +T 14 +C 1+ C2 +C 3+ C4 +C 5+ C6 +C 7+ C8 +C 9+ C1 0+ C1 1 CO ST _N U EV AP AL M IR A_ FE RR O VI AR IA C1 2 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 +T 11 +T 12 +T 13 +T 14 +C 1+ C2 +C 3+ C4 +C 5+ C6 +C 7+ C8 +C 9+ C1 0+ C1 1+ C1 2 CO ST _S AN TO S_ FE RR O VI AR IA C1 3 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 +T 11 +T 12 +T 13 +T 14 +C 1+ C2 +C 3+ C4 +C 5+ C6 +C 7+ C8 +C 9+ C1 0+ C1 1+ C1 2+ C1 3 CO ST _A N TO FA G AS TA _F ER RO VI AR IA C1 4 FO BP ric e+ M TP A+ T1 +T 2+ T3 +T 4+ T5 +T 6+ T7 +T 8+ T9 +T 10 +T 11 +T 12 +T 13 +T 14 +C 1+ C2 +C 3+ C4 +C 5+ C6 +C 7+ C8 +C 9+ C1 0+ C1 1+ C1 2+ C1 3+ C1 4 AN TO FA G AS TA _C AR RE TE RA E1 AN TO FA G AS TA _F ER RO VI AR IA E2 E1 +E 2 AR IC A_ CA RR ET ER A E3 E1 +E 2+ E3 AR IC A_ FE RR O VI AR IA E4 E1 +E 2+ E3 +E 4 IL O _C AR RE TE RA E5 E1 +E 2+ E3 +E 4+ E5 IQ U IQ U E_ CA RR ET ER A E6 E1 +E 2+ E3 +E 4+ E5 +E 6 IQ U IQ U E_ FE RR O VI AR IA E7 E1 +E 2+ E3 +E 4+ E5 +E 6+ E7 N U EV AP AL M IR A_ CA RR ET ER A E8 E1 +E 2+ E3 +E 4+ E5 +E 6+ E7 +E 8 PT O SU AR EZ _C AR RE TE RA E9 E1 +E 2+ E3 +E 4+ E5 +E 6+ E7 +E 8+ E9 PT O SU AR EZ _F ER RO VI AR IA E1 0 E1 +E 2+ E3 +E 4+ E5 +E 6+ E7 +E 8+ E9 +E 10 SA N TO S_ CA RR ET ER A E1 1 E1 +E 2+ E3 +E 4+ E5 +E 6+ E7 +E 8+ E9 +E 10 +E 11 SA N TO S_ FE RR O VI AR IA E1 2 E1 +E 2+ E3 +E 4+ E5 +E 6+ E7 +E 8+ E9 +E 10 +E 11 +E 12 F ig u ra 4. 7: D A T A N O R M Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 117 F ig u ra 4. 8: F ic h er o d e te x to el ec m o d Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 118 Los ficheros principales de datos que se utilizan como entrada se denominan: 1. Dataset Elección Modal (libro Excel) 2. RDataset (libro Excel) 3. Elecmod (archivo txt) 4.7.1. Archivo Excel Dataset Eleccion Modal Contiene los datos iniciales junto las transformaciones realizadas para la RB y la RN. 1. Hoja DATASET CFBC original: datos de partida de comercio exterior (INE). 2. Hoja DATASET Eleccion Modal: datos transformados para usar en R (inputs). 3. Consulta Análisis: consulta dinámica al dataset inicial para agrupar los regis- tros por OD & tipos de mercanćıa, cuyas columnas corresponden a los distintos modos de transporte. 4.7.2. Hoja Excel DATASET Elección Modal A continuación se describen las tablas del DATASET Elección modal resumido en la Figura 4.5. De arriba a abajo la forma de interpretarlo es la siguiente: Las primeras columnas muestran el sentido de Import/Export, el tipo de mer- canćıa, los ID de origen y destino, el precio FOB de la mercanćıa ($/ton), y el flujo de ton/año. Las siguientes columnas contienen, para cada alternativa de transporte los flujos de carga en toneladas/año (ton/año). A partir de las ton/año de cada alternativa se determinan los porcentajes de reparto observados reales entre alternativas. Este valor es fundamental ya que deter- mina las probabilidades de uso reales por sentido import/export, tipo de mercanćıa y par OD, para cada una de las combinaciones ID1 e ID2. El resultado es el porcentaje obtenido de la división de toneladas/año para cada combinación de las anteriormente Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 119 indicadas, entre la suma total de carga por OD. En base a estos porcentajes, pos- teriormente se determinan los errores relativos y absolutos del Multi Nomial Logit, Red Neuronal y Red Bayesiana, lo que mostrará la bondad en el ajuste de cada una de las técnicas utilizadas. Posteriormente, se muestran los tiempos de viaje (horas) de cada registro por alternativa de transporte. Las celdas con t́ıtulos en azul son las alternativas de ca- rretera y, en naranja alternativas de ferrocarril. De la misma forma, después, se tienen los costes en $/ton. En las siguientes dos columnas se determinan el mı́nimo tiempo y coste de entre todas las alternativas. Finalmente, a partir de las diferencias con los tiempos y costes mı́nimos de cada registro, por OD, en la última tabla se calculan los Incrementos de Tiempo y Coste respecto a la mejor alternativa. Por ejemplo, en la tabla siguiente la columna etiquetada como T ARICA Ferrocarril indica que para ese registro el menor tiempo de viaje correspondeŕıa a la opción de acceder al puerto de Arica por Ferrocarril (igual a 0), ya que el valor de acceder a Arica por Carretera es mayor (igual a 118). Todos los tiempos de ese registro corresponden a la diferencia en tiempo con respecto al mejor caso. Con respecto a los costes la interpretación es similar. 4.7.3. Archivo Excel RDataset Este archivo contiene las siguientes hojas de cálculo: 1. DATA1: datos procedentes del fichero Excel “Dataset Eleccion Modal”, expli- cado anteriormente, normalizados al rango (-50, 800) en el caso de los tiempos, y al rango (-50, 500) en el caso de los costes. Este fichero contiene los siguientes grupos de columnas en orden de izquierda a derecha: a) Encabezados gris: tipos de mercanćıa / ID por OD, precio FOB, TMPA. b) Encabezados azul: incremento en tiempo respecto a la mejor alternativa. c) Encabezados naranja: Incremento en coste respecto a la mejor alternativa. Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 120 d) Encabezados azul: incremento en tiempo respecto a la mejor alternativa, normalizado al rango (-50, 800). e) Encabezados naranja. incremento en coste respecto a la mejor alternativa normalizado al rango -50, 500. f ) Encabezado azul oscuro. Porcentajes de reparto modal (valor fundamental para realizar la comparativa entre los distintos métodos MNL, RN y RB). 2. LOGIT: incluye los datos anteriores y los modelos Logit ajustados del proyecto CFBC, de tal forma que muestra los modelos propios del mismo para estimar el reparto de mercanćıas dado por los Logit. Estos datos sirven para luego compararlos con los resultados de las RN y RB. 3. DATANORM: conjunto de datos normalizados para la exportación a R, aśı como una serie de columnas para construir la cadena de caracteres del modelo usado en R. 4. Resultados RB y Resultados RRNN: contienen los resultados obtenidos de la programación en R. 5. RESUMEN: contiene la comparación entre modelos. 4.7.4. Fichero de texto elecmod Este fichero contiene los datos del Excel exportados en formato compatible con R. Además, dicho fichero puede ser importado en RStudior con la opción Import Dataset. 4.8. Propósitos del modelo de elección modal Distintos cargadores toman decisiones sobre la elección entre las alternativas de transporte disponibles, que dependen de muchos factores particulares los cuales no se pueden recoger en el modelo general por la tipoloǵıa de información. Por tanto, los propósitos principales del modelo de elección modal son: Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 121 1. Reflejar cómo, dados unos factores sobre los que interesa estudiar variaciones, se reparten los flujos de carga entre las opciones disponibles. 2. Estimar las elasticidades: cúanto vaŕıan los porcentajes de reparto al cambiar los factores de decisión. 3. Estudiar los dos principales factores de la elección modal: 4. Tiempo. Para saber cómo afecta la reducción de tiempos de viaje que permi- tirá lograr el CFBC, una vez en operación. 5. Coste. Para saber cómo los precios del CFBC afectarán a las captaciones de mercanćıa. 4.9. Calibración del MNL Se llevaron a cabo con el software estad́ıstico R por ser la herramienta estad́ıstica con mayor variedad de libreŕıas de programación y técnicas de este tipo desarrolladas por investigadores, teniendo en cuenta además las libreŕıas disponibles espećıficas para RB mencionadas en el caṕıtulo correspondiente. Las funciones de utilidad de las mercanćıas (exportadas / importadas), se distin- guieron en: 1. Flujos con salida al mar: Ui, j,m, t, carretera, p = β0+ β1(τi/p, p/j,m, t, carretera+ τp/i, j/p,m, t,mar)+ β2(ci/p, p/j,m, t, carretera+ cp/i, j/p,m, t,mar) Ui, j,m, t,multi, p = β0+ β1(τi/p, p/j,m, t,multi+ τp/i, j/p,m, t,mar)+ β2(ci/p, p/j,m, t,multi+ cp/i, j/p,m, t,mar) Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 122 2. Flujos internos sin salida al mar: Ui, j,m, t, carretera, p = β0+ β1(τi, j,m, t, carretera)+ β2(ci, j,m, t, carretera) Ui, j,m, t,multi, p = β0+ β1(τi, j,m, t,multi)+ β2(ci, j,m, t,multi) siendo τi/p, p/j,m, t: tiempo entre nodo de salida (exportación) / llegada (importación) y puerto de la ruta. Carretera / Multimodal carretera y ferrocarril. Por OD, periodo temporal y tipo de carga. τp/i, j/p,m, t,mar: tiempo entre nodo de salida / llegada y puerto de la ruta, por mar. Por OD, periodo temporal y tipo de carga. ci/p, p/j,m, t: coste entre nodo de salida / llegada y puerto de la ruta. Carretera / Multimodal carretera y ferrocarril. Por OD, periodo temporal y tipo de carga. cp/i, j/p,m, t,mar: Coste entre nodo de salida / llegada y puerto de la ruta, por mar. Por OD, periodo temporal y tipo de carga. τi, j,m, t: Tiempo de viaje entre par OD. Carretera / Multimodal. ci, j,m, t: coste de viaje entre par OD interior. Carretera / Multimodal. τi, j,m, t: tiempo de viaje entre par OD. Carretera / Multimodal. i: ID de zona de transporte de origen. Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 123 j: ID de zona de transporte de destino. p: ID de puerto. m: ID de mercanćıa. t: D de periodo temporal. multi: ruta multimodal. Las consideraciones iniciales del modelo fueron: ajuste por cada tipo de mercanćıa (contenedores, graneles limpios, sucios y ĺıquidos); parámetros asociados a valores de tiempos y costes de cada alternativa; parámetros para recoger la preferencia por modos o puertos como en el caso de los contenedores (se hab́ıa observado una prefe- rencia por el puerto de Ilo a igualdad de condiciones de tiempo y coste debido a sus instalaciones portuarias); se incluye un parámetro dependiente alternativo para el puerto de Arica que incrementaba su atractividad como entrada/salida al mar, debi- do a las instalaciones de dicho puerto para el transporte de contenedores; el puerto de Santos, es menos atractivo para la mercanćıa boliviana debido a la distancia y a la congestión del mismo. De tal forma que aśı se consideraron tres tipos de parámetros en el modelo: 1. Un parámetro de efectos fijos asociado al puerto. 2. Un parámetro de efecto del coste por cada tipo de mercanćıa. 3. Un parámetro de efecto del tiempo por cada tipo de mercanćıa. Los valores de los parámetros ajustados se omiten por estar sujetos a cláusulas de confidencialidad del proyecto del Viceministerio de Transporte boliviano, pero en la tabla siguiente puede comprobarse la significación de los parámetros de los modelos, en este caso para el Puerto de Arica, que es una de las alternativas portuarias más importantes en cuanto al transporte de mercanćıas, del total de alternativas existente para la exportación e importación. Los parámetros de la función de utilidad que no mostraron ser estad́ısticamente significativos en el test de significación fueron eliminados del modelo hasta seleccionar los modelos indicados en la Tabla 4.2. Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 124 Cuadro 4.2: Parámetros función de utilidad / p-valor del test de significación Tipo de Carga Parámetro p-valor Significación Contenedores Preferencia Puerto Arica 0.0000 SI Contenedores Coste 0.0000 SI Contenedores Tiempo 0.0000 SI Graneles Sólidos Sucios Coste 0.0000 SI Graneles Sólidos Sucios Tiempo 0.0000 SI Graneles Sólidos Limpios Coste 0.5331 NO Graneles Sólidos Limpios Tiempo 0.0001 SI Graneles Ĺıquidos Sucios (combustibles) Coste 0.0000 SI La Tabla 4.2 muestra el ajuste resultante con la información utilizada en situación base, en el que se verifica que las variables coste y tiempo son determinantes en la elección modal, considerando las funciones de utilidad por tipo de mercanćıa, a excepción del coste en los graneles sólidos limpios. Aśı también, la variable auxiliar correspondiente al efecto de la preferencia por el puerto de Arica en las alternativas de transporte analizadas resultó ser estad́ıstica- mente significativa, lo que equivale a interpretar que los cargadores, a igualdad de condiciones, prefieren usar este puerto debido a las buenas condiciones que tiene para las operaciones portuarias. Esto se traduce, como veremos en las siguientes imágenes, en que este puerto se sitúa como el óptimo de las alternativas posibles de conexión por carretera para la exportación de entre las opciones de conexión en situación base. Ese hecho encaja con la realidad al ofrecer instalaciones especialmente aptas para el tráfico de contenedores que no se explican sólo en término de tiempos y costes de acarreo. En el caso de los graneles sólidos limpios, como se ha adelantado antes, sólo la variable tiempo resultó ser significativa, lógico al ser principalmente de productos agŕıcolas para los que los tiempos de viaje son determinantes ante posibles deterioros o perecimientos. Para los graneles ĺıquidos (principalmente combustible) el principal factor de decisión se observó que era el coste, ya que el tiempo no influye en su deterioro. Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 125 Aśı, los resultados del MNL se utilizaron para estimar la división de los flujos para las alternativas terrestres, por tipo de carga y a nivel global. De esta forma se obtienen las matrices OD de flujos por alternativas α, Fα, t,m, i, j, tal que es factible conocer las captaciones de carga por modo, en base a las utilidades (probabilidades de uso de las alternativas de transporte) y las asignaciones a red relativas al reparto modal estimado. En la Tabla 4.3 se muestra un ejemplo asignación a red, todo o nada, con el flujo (toneladas de carga transportada). Los modos de transporte se representan aśı: gris=carretera, rojo=ferrocarril, azul claro=maŕıtimo y azul oscuro=fluvial (hidrov́ıa Paraguay-Paraná). El grosor de cada modo representa las toneladas transportadas en cada tramo (total flow). La imagen superior muestra el flujo de carga en la situa- ción base y en la imagen inferior en la situación futura, con el corredor ferroviario funcionando al 100 %. Por motivos de confidencialidad no se muestran las cantidades transportadas, tipo de mercanćıa y año de análisis. Las conclusiones derivadas de los resultados de los errores de estimación de las probabilidades de uso respecto a los datos observados reales son: 1. Principalmente, el valor del error medio cuadrado y el error máximo absoluto para la conexión con el puerto de Arica por carretera son muy elevados. Esto es peligroso ya que se ha demostrado que este puerto es una de las salidas más im- portantes de las exportaciones hacia el océano Paćıfico. Por tanto, desviaciones aśı repercuten en un mal dimensionamiento de los recursos e infraestructuras, y supone una mala planificación a futuro y unos condicionantes económicos y financieros de inversión mucho más elevados a largo plazo . 2. En relación a la otra alternativa principal de salida, el puerto de Antofagasta, el error medio cuadrado obtenido está en unos valores razonables, si bien, los errores máximos absolutos son muy elevado, entre un 93 % y un 99,5 %, lo cual es peligros para las estimaciones futuras. 3. Además, se suma el desconocimiento de las relaciones existentes de dependencia entre las variables significativas, que śı existen en las Redes Bayesianas. Las conclusiones de los anteriores gráficos a partir de las estimaciones del modelo Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 126 Cuadro 4.3: Resultados ajuste MNL Error Medio Cuadrado (MNLogit) Error Máximo Absoluto (MNLogit) ANTOFAGASTA Road (carretera) 15,08 % 99,48 % ANTOFAGASTA Rail (ff.cc.) 16,26 % 93,73 % ARICA Road (carretera) 73,71 % 100,00 % ARICA Rail (ff.cc.) 19,67 % 41,66 % ILO Road (carretera) 14,05 % 100,00 % IQUIQUE Road (carrete- ra) 27,10 % 100,00 % IQUIQUE Rail (ff.cc.) 5,64 % 10,24 % NUEVAPALMIRA Road (carretera) 19,56 % 100,00 % PTOSUAREZ Road (ca- rretera) 6,84 % 95,49 % PTOSUAREZ Rail (ff.cc.) 5,03 % 90,26 % SANTOS Road (carrete- ra) 8,28 % 100,00 % SANTOS Rail (ff.cc.) 3,78 % 10,24 % Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 127 Puerto Ilo Puerto Arica Puerto Iquique Puerto Antofagasta Puerto Ilo Puerto Arica Puerto Iquique Puerto Antofagasta Figura 4.9: Ejemplo de comparativa situación base (arriba) y situación futura (abajo) Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 128 obtenidas en la anterior tabla, tomando de ejemplo las exportaciones bolivianas por el océano Paćıfico: 1. Situación base: la v́ıa principal de salida de la carga es la conexión hasta el puerto de Antofagasta y desde aqúı por v́ıa maŕıtima. Hasta este puerto el tráfico llega en modo ferroviario. También se realizan salidas, pero menores, por Arica e Ilo, conectando por carretera. 2. Situación futura: con el corredor ferroviario funcionando al 100 %, éste se po- siciona como un modo competitivo frente a la carretera, en costes y tiempos, para el transporte de mercanćıas. De esta forma, las mercanćıas se reparten entre Antofagasta y el puerto de Ilo. En este último caso se aprecia como el flujo de carga es mayor por ferrocarril que por carretera, con lo que el total de carga transportada aumenta respecto la situación base. Por tanto, las funciones de utilidad resultantes de la aplicación del MNL para calcular la elección modal son consistentes en la situación base, y por tanto, pueden ser usadas para las proyecciones de carga en situación futura. Esto es importante en la etapa de asignación a la hora de calcular las captaciones posibles en el corredor ferroviario. 4.10. Calibración de la RN En el caso de la Red Neuronal, los datos de partida se muestran en la Tabla 4.4. En cuanto a los rangos de las variables de entrada, son: 1. Precio FOB del producto. Normalizada al rango -1 a +1. 2. Flujo anual en toneladas métricas (MTPA). Normalizada al rango -1 a +1. 3. Diferencia de tiempo de cada alternativa con respecto a la alternativa de tiempo mı́nimo (T1 a T12). Normalizada al rango -1 a +1. 4. Diferencia de costes de cada alternativa con respecto a la alternativa de coste mı́nimo (C1 a C12). Normalizada al rango -1 a +1. Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 129 Cuadro 4.4: Variables de entrada de la RN Input Variable Description Time Tk = tk −mink tk Time difference to the best alter- native Cost Ck = ck −mink ck Cost difference to the best alter- native Freight flow per year Fi,j,m Freight flow from the Origin to the Destination. FOB Price FOBi,m Free on Board price of the pro- duct at the Origin Figura 4.10: Ejemplo de muestra de datos de exportaciones e importaciones En el caso de las variables de salida, el porcentaje de elección de cada alternativa está Normalizada al rango -0,9 a 0,9. Es decir, todas las variables de entrada de la red neuronal están normalizadas en el rango de -1 a +1, y las salidas de la red neuronal son las probabilidades de elección modal de cada alternativa de transporte pk. Por lo tanto, hay una salida para cada alternativa k que se evalúa para cada par origen-destino y tipo de flete resultantes de la elección modal pm,i,j,k. En la Figura 4.10 se muestra una imagen del conjunto de datos utilizados de exportaciones e importaciones. El tipo de red neuronal elegida para este caso fue un perceptrón multicapa con una capa oculta equipada con el paquete de red neuronal del software R. La función de activación de las neuronas es una función loǵıstica. Todos los pesos entre neuronas se ajustan mediante un algoritmo de entrenamiento por retropropagación de errores. El entrenamiento se realizado con la libreŕıa neuralnet implementada en R y se utiliza el algoritmo de entrenamiento de retropropagación. Riedmiller et al. (1993). La red ajustada tiene 2 neuronas en la capa oculta, ya que al probar con 4 y 6 neuronas en la capa oculta no se observan mejoras significativas. Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 130 -0. 20 53 5 -1. 68 10 2 C14 2.3 65 18 0.0 64 03 C13 -4.78 396 -48 .20 43 1 C12 -2.3048 1.0 12 99 C11 -2.2014 0.0 91 67 C10 3.52618 2.1 16 04 C9 0.83017 0.6 88 82 C8 0.299191.7 66 38 C7 -2.62252.0 22 46 C6 7.09807 27 .20 49 8 C5 -2.95776 -5. 68 69 9 C4 0.34282 16 .03 30 3 C3 0.21792 -2.47 01 C2 1.15498 0.79849 C1 1.19547 -2.52313 T14 -0.28982 -1.52643 T13 1.40958 -14.91763 T12 -3.44796 17.39171 T11 3.06075 -2.70787 T10 0.76994 0.79748T9 -1.09472 -1.18421T8 -2.92595 10.13718 T7 0.14237 1.82608 T6 -5.28121 15.39926 T5 -3.36278 -13.06918 T4 0.87546 1.45149 T3 1.49659 -16.84672 T2 7.31926 -1.72892 T1 -0.16529 -4.92569 MTPA -1.47025 3.21676 FOBPrice 0.00026 0.09368 0.04579 0.31577 -0.257090.00007 -9.89859 1.1 72 82 -0. 00 00 1 15 .12 61 2 -2. 36 74 1 -4. 22 21 -0.00007 -0.01668 0.01485 -0.21029 -4.78782 0.00002 1.27265 -0.50909 -0.000032.67305 0.6035 0.9 45 36 E12 E11 E10 E9 E8 E7 E6 E5 E4 E3 E2 E1 -1.05219 1.70019 1 -0.89995 -0.88438 -0.91579 -0.72609 3.92036 -0.90002 -0.67832 -0.50065 -0.89996 -4.1293 -1.13144 -1.24134 1 Figura 4.11: Perceptron multicapa entrenada por el conjunto de datos Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 131 Cuadro 4.5: Resultados ajuste RN Error Medio Cuadrado (RN) Error Máximo Absoluto (RN) ANTOFAGASTA Road (carretera) 14,389 % 92,214 % ANTOFAGASTA Rail (ff.cc.) 16,262 % 98,735 % ARICA Road (carrete- ra) 30,690 % 97,492 % ARICA Rail (ff.cc.) 0,034 % 0,730 % ILO Road (carretera) 13,723 % 96,980 % IQUIQUE Road (carre- tera) 24,377 % 91,559 % IQUIQUE Rail (ff.cc.) 0,004 % 0,091 % NUEVAPALMIRA Road (carretera) 14,497 % 100,000 % PTOSUAREZ Road (carretera) 5,254 % 99,959 % PTOSUAREZ Rail (ff.cc.) 4,201 % 88,618 % SANTOS Road (carre- tera) 8,092 % 99,786 % SANTOS Rail (ff.cc.) 0,010 % 0,178 % Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 132 El la Figura 4.11 se muestra el gráfico de la red neuronal entrenada. La red neuronal tiene un total de 30 entradas correspondientes al precio FOB, el flujo de carga por año en toneladas y la diferencia de tiempo y costo para cada una de las 14 alternativas de transporte. La red tiene solo dos neuronas en la capa oculta. Se entrena con el 80 % de los registros del conjunto de datos, mientras que el 20 % restante se utiliza para la validación cruzada. En la Tabla 4.5 se muestran los errores obtenidos de la estimación con la RN, para cada una de las alternativas analizadas. Las principales conclusiones con este ajuste son, a efectos de error respecto a la elección modal de los datos observados reales, considerando que no se han utilizado estos datos para realizar ninguna asignación a red ya que no es el objeto de este trabajo, son: 1. Inicialmente, un menor conocimiento de las relaciones entre las variables que śı podemos encontrar en el MNL y, sobre todo en las RB. Esto es aśı por en concepto de “caja negra” inherente a las RN, al interpretar las relaciones de las capas ocultas del perceptrón multicapa con las entradas y salidas. 2. Se comprueba que no hay diferencias significativas en los resultados utilizando dos capas, y utilizando cuatro o seis, por lo que se opta por el modelo más sencillo con dos capas. 3. En el caso del error máximo absoluto, sigue habiendo valores muy próximos a 100 %, como es el caso de la conexión por ferrocarril con el puerto de Antofagas- ta, y las conexiones por carretera con los puertos de Arica, Ilo, Nuevapalmira, puerto Suárez, y Santos. Como se ha dicho en el caso anterior, estos porcentajes suponen un riesgo desde el punto de vista del cálculo de las elecciones modales, y, por tanto, las consecuencias derivadas para el proyecto en cuento al cálculo de las captaciones del ferrocarril, ya que supone un mal dimensionamiento de las necesidades futuras de infraestructura. Eso implica desviaciones a su vez en los recursos necesarios para la operativa del servicio, para el cálculo de costes e ingresos, el coste total del proyecto y las necesidades o no de financiación. 4. En relación al error medio cuadrado, los valores son muy similares a las esti- maciones del MNL, si bien, mejora en el caso de la conexión por carretera del Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 133 puerto de Arica, pasado de un 73,71 % antes, a un 30,69 % en las RN. Este indicador también mejora para las conexiones ferroviarias del puerto de Arica, Iquique y Santos, alrededor de un 19 %, 5 % y 3,5 % respectivamente. 4.11. Calibración de la RB A partir del mismo conjunto de datos usado para los modelos MNL en R, em- pleando las siguientes variables de red para cada par origen-destino. 1. Tiempos por alternativa 2. Coste por alternativa 3. Flujo anual por tipo de mercanćıa en toneladas métricas (MTPA) 4. Precio FOB (Free On Board) por producto o tipo de mercanćıa. 5. % de reparto por alternativa Una diferencia con respecto a la codificación empleada para el ajuste de los modelos MNL es que en ellos se desarrolló un modelo independiente para cada tipo de mercanćıa, mientras que para la red bayesiana se empleó una sola red para todas, aunque se incluyó el factor precio FOB como indicador del tipo de mercanćıa (los graneles tienen bajos precios FOB y los contenedores valores altos). La codificación de las variables se explica en la Tabla 4.6. El proceso de calibración siguió los siguientes pasos, cuya base teórica está justi- ficada y explicada en el apartado 2 de esta memoria: 1. Aplicación del test de Doornick-Hansen (DH) de normalidad, implementado en el paquete asbio de R, el cual mostró que las variables no se ajustaban adecuadamente a una distribución Normal. 2. Transformación de los datos mediante la transformación “Nonparanormal” pro- puesta por Lui et al. (2009), utilizando el paquete huge de R. 3. Aplicación de nuevo del test de Doornick-Hansen a la muestra transformada para verificar que efectivamente la transformación hab́ıa proporcionado una muestra con distribución Normal. Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 134 Cuadro 4.6: Variables para la Red Bayesiana Entrada Variable Descripción Tiempo Tk = tk −mink tk Diferencia de tiempo con res- pecto al tiempo de la mejor alternativa k. Coste Ck = ck −mink ck Diferencia de coste con res- pecto al coste de la mejor al- ternativa k. Flujo de mer- canćıa por año Fi,j,m Flujo de mercanćıa del origen i al destino j para la mer- canćıa m. Precio FOB FOBi,m Precio FOB del producto en el punto de origen Proporción de uso de la alternativa pm,i,j,k Proporción de mercanćıa del tipo considerado entre el ori- gen i y el destino j que hacen uso de la alternativa conside- rada k. 4. Como restricción para la calibración de la red bayesiana se incluyó que los nodos correspondientes a las proporciones pm,i,j,k no pudieran ser oŕıgenes de los links del grafo. Esto se debe a que estas variables han de ser explicadas en todos los casos a partir del resto de variables de la red. 5. Aplicación del algoritmo max−min hill−climbing (mmhc) de Tsamardinos et al. (2016), para la calibración de la red bayesiana. Se aplica una lista de res- tricciones para que ningún arco de la red parta de los nodos correspondientes a los porcentajes de reparto en la elección (E1 a E12). 6. Aplicación de la funcion arc.strength en R, que permite conocer la importancia o fuerza de cada enlace de la red ajustada, sobre la red bayesiana resultante. 7. Obtención de los valores estimados de la red para las densidades condicionadas con la función bn.fit implementada en el paquete bnlearn de R. El resultado de la calibración de la RB proporcionó los resultados de la Tabla 4.7. Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 135 Cuadro 4.7: Resultados de la calibración de la RB Nodes: 42 Arcs: 61 Undirected arcs: 0 Directed arcs: 61 Average Markov blanket size: 4,86 Average neighbourhood size: 2,90 Average branching factor: 1,45 Learning algorithm: Max-Min Hill- Climbing Constraint-based method: Max-Min Parent Children Conditional indep. test: Pearson’s Co- rrelation Score-based method: Hill-Climbing Score: BIC (Gauss.) Alpha threshold: 0,05 Penalization coefficient: 3,061246 Tests used in the learning procedure: 4504 Optimized: TRUE Cuadro 4.8: Resultados ajuste RB Error Medio Cuadrado (RB) Error Máximo Absoluto (RB) ANTOFAGASTA Road (carretera) 8,50 % 37,04 % ANTOFAGASTA Rail (ff.cc.) 7,40 % 39,53 % ARICA Road (carretera) 29,48 % 57,00 % ARICA Rail (ff.cc.) 4,05 % 48,81 % ILO Road (carretera) 12,26 % 46,24 % IQUIQUE Road (carrete- ra) 13,27 % 39,66 % IQUIQUE Rail (ff.cc.) 2,20 % 46,96 % NUEVAPALMIRA Road (carretera) 15,83 % 47,30 % PTOSUAREZ Road (ca- rretera) 3,55 % 46,86 % PTOSUAREZ Rail (ff.cc.) 2,20 % 46,96 % SANTOS Road (carrete- ra) 10,27 % 48,10 % SANTOS Rail (ff.cc.) 6,30 % 50,15 % Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 136 F ig u ra 4. 12 : G ra fo d e la R ed B ay es ia n a Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 137 Por otro lado, en la Figura 4.12 se muestra el grafo de la RB generada, donde se observan las relaciones entre los nodos de costes (C1. . . C14) y tiempos (T1. . . T14) para las distintas alternativas (E1. . . E14), y cómo unos pocos de ellos en conjunto con los precios FOB y el flujo de mercanćıa por año (MTPA), explican la mayor parte de porcentajes de elección observados. La figura de la RB obtenida nos da la relación entre las diferentes variables, por lo que su interpretación aporta más información que en el caso de las RN y MNL. Aśı, en el caso de las alternativas E1, E2, E3, E4, E6, E7, E10 y E12 las variables fundamentales son el precio FOB y la cantidad de toneladas transportadas (MTPA). Mientras que, en otras alternativas, E5, E8 y E11 (modo únicamente carretero), pre- domina el Coste asociado, bien de la propia alternativa, bien de un tramo común de otra en competencia. En el caso de los Tiempos de transporte, éstos dependen de tiempos de tramos igualmente en competencia, o de subtramos de alternativas ma- yores para el mismo modo de transporte (ferrocarril o carretera). Los Tiempos, a su vez, influyen en los costes totales de transporte, teniendo en cuenta la transformada monetaria de los mismos dependiendo de la utilización de un determinado número de recursos. Y en algunos casos, los costes derivan en un mayor o menor tiempo en el empleo de una u otra alternativa. Como ejemplo, el tiempo de la alternativa T1 (Ari- ca carretera) influye en los costes de las alternativas C4 (Ilo carretera) y C8 (Arica ferroviaria), condicionado por la conexión existente en estos puertos por carretera y ferrocarril; y por otro lado, el coste de la alternativa C6 (Santos carretera), influye directamente en el tiempo de transporte T1 (Arica carretera), evidentemente, al ser el tramo de transporte más extenso de toda la red, entre la costa del Atlántico y la costa del Paćıfico, habida cuenta de la desconexión ferroviaria actual entre la red andina y la red oriental en el tramo boliviano. En la Tabla 4.8 se muestran los errores obtenidos de la estimación con la RB, para cada una de las alternativas analizadas: Las principales conclusiones con este ajuste son, a efectos de error respecto a la elección modal de los datos observados reales, considerando que no se han utilizado estos datos para realizar ninguna asignación a red ya que no es el objeto de este trabajo, son: 1. Respecto al error cuadrático medio, todos los resultados mejoran las estimacio- Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 138 nes del MNL y la RN, salvo el caso de la conexión ferroviaria con los puertos de Arica, Iquique y Santos, que vaŕıan levemente respecto a la RN un 4 %, un 2 % y un 6 % respectivamente. Y en cuanto a las conexiones por carretera con los puertos de Nuevapalmira y Santos, igualmente suben respecto a la RN un 1 % y un 2 %, respectivamente. En general, errores muy pequeños. 2. Respecto al error absoluto máximo, de las doce alternativas, se mejora en nueve respecto de la RN, sólo empeorando en el caso de las conexiones ferroviarias de Arica, Iquique y Santos, entre un 40 % y un 50 % respecto de la RN. En el caso de Iquique, es un puerto con una demanda residual, por lo que su efecto es prácticamente nulo. En el caso de Santos (Brasil), es un tráfico de muy largo recorrido, unos 3.000 Km, por lo que es factible una desviación aśı en las capta- ciones. Por último, en el caso del puerto de Arica, probablemente la desviación venga producida por la variable de “preferencia” que incentiva esta conexión al ser el puerto que mejor operativa tiene de todos, por lo que la relación entre esta variables y las de tiempo y coste han influido en la estimación. 3. Queda demostrado que la RB arroja unas desviaciones, considerando los indi- cadores de bondad explicados, mejores que el MNL y la RN. 4.12. Ajuste en RStudio de RN y RB La Figura 4.13 muestra el interfaz de RStudio donde ya se puede realizar el ajuste de las redes. Todo el código está implementado en el script trainnet.R. Basta con abrir este script y ejecutar los trozos de código deseados para ir obteniendo los resultados por pasos. 4.12.1. Ajuste de redes neuronales El script para ajustar las redes neuronales usa la libreŕıa neuralnet . El script está ordenado según los siguientes pasos: Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 139 Figura 4.13: Interfaz RStudio Figura 4.14: Instalación libreŕıa neuralnet Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 140 1. lee el fichero con los datos para la elección modal, los guarda en el data frame “elecmod” y genera el modelo para ajuste de la RN. library(neuralnet) #Leo la tabla de datos de elección modal elecmod <- read.delim(Ç:/R/rrnn/elecmod.txt”) #Modelo de la RRNN ffff <- E1+E2+E3+E4+E5+E6+E7+E8+E9+E10+E11+E12 ∼ FOBPrice+MTPA+T1+T2+T3+T4+T5+T6+T7+T8+T9+T10+ T11+T12+T13+T14+C1+C2+C3+C4+C5+C6+C7+C8+C9+C10+C11+C12+C13+C14 computeSet <- data.frame(FOBPrice = elecmod$FOBPrice, MTPA = elecmod$MTPA, T1 = elecmod$T1, T2 = elecmod$T2, T3 = elecmod$T3, T4 = elecmod$T4, T5 = elecmod$T5, T6 = elecmod$T6, T7 = elecmod$T7, T8 = elecmod$T8, T9 = elecmod$T9, T10 = elecmod$T10, T11 = elecmod$T11, T12 = elecmod$T12, T13 = elecmod$T13, T14 = elecmod$T14, C1 = elecmod$C1, C2= elecmod$C2, C3 = elecmod$C3, C4 = elecmod$C4, C5 = elecmod$C5, C6 = elecmod$C6, C7 = elecmod$C7, C8 = elecmod$C8, C9 = elecmod$C9, C10 = elecmod$C10, C11 = elecmod$C11, C12 = elecmod$C12, C13 = elecmod$C13, C14 = elecmod$C14, E1 = elecmod$E1, E2 = elecmod$E2, E3 = elecmod$E3, E4 = elecmod$E4, E5 = elecmod$E5, E6 = elecmod$E6, E7 = elecmod$E7, E8 = elecmod$E8, E9 = elecmod$E9, E10 = elecmod$E10, E11 = elecmod$E11, E12 = elecmod$E12) 2. Genera la muestra para ajuste de la red neuronal, tal que el conjunto de datos se divide en dos muestras: una para el ajuste y otra para validación cruzada. El 80 % de los casos se asignan aleatoriamente al conjunto de datos de entrenamiento. #Muestra de ajuste: 80 % de la muestra computeSet$random <- runif trainset <- subset(computeSet, random <= 0.8) crossValSet <- subset(computeSet, random > 0.8) computeSet2 <- computeSet[, 1:30] crossValSet2 <- crossValSet[, 1:30] 3. Ajuste de las redes usando modelos con 2, 4, y 6 neuronas en la capa oculta. Para cada ajuste se guardan los resultados en los ficheros netSol2.txt y suce- sivos. A) Usando el conjunto de datos crossValSet2 entonces se guardan los resultados del ajuste solo para el conjunto de datos de validación. B) Usando computeSet2 se guarda el conjunto de datos completo. El ajuste se hace por Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 141 el algoritmo de retropropagación (backpropagation) de los errores, como ya se indicó en la explicación teórica. #Ajuste de los modelos de redes nn2 <- neuralnet(ffff, trainset, hidden= c(2), rep=1, lifesign = ”full”, stepmax=1e6, threshold = 0.01) rr <- compute(nn2, crossValSet2) write.table(nn2$response, Ç:\\R\\rrnn\\netSol2.txt”) nn4 <- neuralnet(ffff, trainset, hidden= c(4), rep=1, lifesign = ”full”, stepmax=1e6, threshold = 0.01) rr <- compute(nn4, computeSet2) write.table(netSol$response, Ç:\\R\\rrnn\\netSol4.txt”) nn6 <- neuralnet(ffff, trainset, hidden= c(6), rep=1, lifesign = ”full”, stepmax=1e6, threshold = 0.01) rr <- compute(nn6, computeSet2) write.table(netSol$response, Ç:\\R\\rrnn\\netSol6.txt”) 4.12.2. Ajuste de redes bayesianas El script para ajustar las redes neuronales usa la libreŕıa bnlearn. 1. Se aplica el test DH de normalidad y su transformación para normalizar los datos según se ha descrito, en caso de ser necesario. #Redes Bayesianas library(bnlearn) #Test previos y normalización de la muestra dh <- DH.test(computeSet,Y.names=names(computeSet)) tt <- DH.test(computeSet) C <- huge.npn(computeSet) C <- as.data.frame(C) tt <- DH.test(C) tt 2. Se ajusta la red bayesiana usando el dataframe “blckl” como lista de restriccio- nes para el ajuste, tal que todos los arcos descritos por ese listado se eliminan del ajuste. Corresponde a los arcos con origen en los nodos Ei (con i=1,. . . ,12 alternativas de transporte), que corresponde a los porcentajes de elección con destino en el resto de variables. Aśı, la relación de causalidad se da en el sentido de que explicación del porcentaje de elección por el resto de las variables. #Ajuste de la red bayesiana Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 142 rbg <- mmhc(C, blacklist = blackl) bns <- arc.strength(rbg, C) bns <- boot.strength(C) bnf <- bn.fit(rbg, C) bnstruct <- bn.net(bnf) 3. Finalmente, se utiliza la RB para ajustar los datos de la muestra: se obtiene una predicción para cada variable de salida; se almacenan todas en el mismo data frame; por último son exportados. #Generacion de la muestra con las predicciones pp1 <- predict(bnf, .E1”, C) pp <- as.data.frame(pp1) pp$pp1 <- pp$pp1 - C$E1 pp2 <- predict(bnf, .E2”, computeSet) pp$E2 <- pp2 - C$E2 pp3 <- predict(bnf, .E3”, computeSet) pp$E3 <- pp3 - C$E3 pp4 <- predict(bnf, .E4”, computeSet) pp$E4 <- pp4 - C$E4 pp$E5 <- predict(bnf, .E5”, computeSet) - C$E5 pp$E6 <- predict(bnf, .E6”, computeSet) - C$E6 pp$E7 <- predict(bnf, .E7”, computeSet) - C$E7 pp$E8 <- predict(bnf, .E8”, computeSet) - C$E8 pp$E9 <- predict(bnf, .E9”, computeSet) - C$E9 pp$E10 <- predict(bnf, .E10”, computeSet) - C$E10 pp$E11 <- predict(bnf, .E11”, computeSet) - C$E11 pp$E12 <- predict(bnf, .E12”, computeSet) - C$E12 predict(bnf, .E1”, computeSet) write.table(pp, ”C:\\R\\rrnn\\rby.txt”) 4.13. Resultados Los resultados de Tabla 4.9 muestran el error cuadrático medio y el error máximo absoluto de cada alternativa de transporte, para cada método de estimación utilizado. Las principales conclusiones con este ajuste son, a efectos de error respecto a la elección modal de los datos observados reales, considerando que en el caso de la RN y RB no se han utilizado estos datos para realizar ninguna asignación a red ya que no es el objeto de este trabajo, son: Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 143 C u ad ro 4. 9: R es u lt ad os co m p ar at iv os a ju st e M N L , R N y R B E rr o r M e d io C u a d ra d o E rr o r M á x im o A b so lu to M N L o g it R N R B M N L o g it R N R B A N T O F A G A S T A R oa d (c ar re te ra ) 15 ,0 8 % 14 ,3 89 % 8, 50 % 99 ,4 8 % 92 ,2 14 % 37 ,0 4 % A N T O F A G A S T A R ai l (ff .c c. ) 16 ,2 6 % 16 ,2 62 % 7, 40 % 93 ,7 3 % 98 ,7 35 % 39 ,5 3 % A R IC A R oa d (c ar re te - ra ) 73 ,7 1 % 30 ,6 90 % 29 ,4 8 % 10 0, 00 % 97 ,4 92 % 57 ,0 0 % A R IC A R ai l (ff .c c. ) 19 ,6 7 % 0, 03 4 % 4, 05 % 41 ,6 6 % 0, 73 0 % 48 ,8 1 % IL O R oa d (c ar re te ra ) 14 ,0 5 % 13 ,7 23 % 12 ,2 6 % 10 0, 00 % 96 ,9 80 % 46 ,2 4 % IQ U IQ U E R oa d (c ar re - te ra ) 27 ,1 0 % 24 ,3 77 % 13 ,2 7 % 10 0, 00 % 91 ,5 59 % 39 ,6 6 % IQ U IQ U E R ai l (ff .c c. ) 5, 64 % 0, 00 4 % 2, 20 % 10 ,2 4 % 0, 09 1 % 46 ,9 6 % N U E V A P A L M IR A R oa d (c ar re te ra ) 19 ,5 6 % 14 ,4 97 % 15 ,8 3 % 10 0, 00 % 10 0, 00 0 % 47 ,3 0 % P T O S U A R E Z R oa d (c ar re te ra ) 6, 84 % 5, 25 4 % 3, 55 % 95 ,4 9 % 99 ,9 59 % 46 ,8 6 % P T O S U A R E Z R ai l (ff .c c. ) 5, 03 % 4, 20 1 % 2, 20 % 90 ,2 6 % 88 ,6 18 % 46 ,9 6 % S A N T O S R oa d (c ar re - te ra ) 8, 28 % 8, 09 2 % 10 ,2 7 % 10 0, 00 % 99 ,7 86 % 48 ,1 0 % S A N T O S R ai l (ff .c c. ) 3, 78 % 0, 01 0 % 6, 30 % 10 ,2 4 % 0, 17 8 % 50 ,1 5 % M E D IA 1 7 ,9 2 % 1 0 ,9 6 % 9 ,6 1 % 7 8 ,4 2 % 7 2 ,0 2 % 4 6 ,2 2 % Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 144 0.00% 10.00% 20.00% 30.00% 40.00% 50.00% 60.00% 70.00% 80.00% ANTOFAGASTA_CARRETERA ANTOFAGASTA_FERROVIARIA ARICA_CARRETERA ARICA_FERROVIARIA ILO_CARRETERA IQUIQUE_CARRETERA IQUIQUE_FERROVIARIA NUEVAPALMIRA_CARRETERA PTOSUAREZ_CARRETERA PTOSUAREZ_FERROVIARIA SANTOS_CARRETERA SANTOS_FERROVIARIA ECM para cada modelo & alternativa de transporte RB RRNN Logit Figura 4.15: Error cuadrático medio por alternativa de transporte 1. Se observa una precisión similar para los modelos de RN y RB, si bien la RB mejora ligeramente esta última a la RN en las alternativas más utilizadas y con mayor flujo de mercanćıas: Arica por carretera, Antofagasta y Puerto Suárez. 2. El MNL es, en general, el modelo con menor precisión, aunque ofrece la ventaja de que sus parámetros son fáciles de interpretar y comprender. 3. A nivel global se aprecia que, en valor medio, la RB supera al MNL y a la RN. Ligeramente en el caso del error medio cuadrado de la RB respecto la RN, un 9,62 % contra un 10,96 %, y en mayor medida contra el MNL, un 17,92 %. Y de forma contundente en el caso del error máximo absoluto, un 46,22 % (RB) frente a un 72,02 % (RN), y un 78,42 % (MNL). 4. De forma gráfica, las Figuras 4.15 y 4.16 muestran lo observado en la tabla anterior, la RB supera a los otros métodos en la mayoŕıa de los casos, espe- cialmente en los más relevantes que son los indicados anteriormente: Arica por carretera, Antofagasta y Puerto Suárez. 5. Queda demostrado aśı que la aproximación bayesiana en el ajuste de las esti- Caṕıtulo 4. Caso de estudio: Corredor Ferroviario Bioceánico Central 145 0.00% 20.00% 40.00% 60.00% 80.00% 100.00% 120.00% ANTOFAGASTA_CARRETERA ANTOFAGASTA_FERROVIARIA ARICA_CARRETERA ARICA_FERROVIARIA ILO_CARRETERA IQUIQUE_CARRETERA IQUIQUE_FERROVIARIA NUEVAPALMIRA_CARRETERA PTOSUAREZ_CARRETERA PTOSUAREZ_FERROVIARIA SANTOS_CARRETERA SANTOS_FERROVIARIA Error Absoluto Máximo para cada modelo & alternativa de transporte RB RRNN Logit Figura 4.16: Error máximo absoluto por alternativa de transporte maciones de la elección modal, para las alternativas planteadas en este modelo, es mejor que en el caso de las técnicas clásicas del MNL y algo más recientes de las RN. Caṕıtulo 5 Conclusiones De los resultados obtenidos se pueden obtener las siguientes conclusiones. 1. En cuanto a la consecución de los objetivos generales y espećıficos definidos inicialmente: a) Objetivos generales: el objetivo a.1 (mejorar el proceso de decisión de via- jeros y operadores de carga) se alcanza ya que en este tipo de proyectos de planificación a futuro es habitual que exista una fase de participación pública y declaración de preferencias, en la que las entidades participantes (públicas y privadas) muestran y explican a los usuarios y operadores de carga las distintas alternativas de transporte. La aplicación de las redes bayesianas para la obtención de resultados de cada alternativa, en com- paración con las otras técnicas, demuestra en este caso que ofrece mejores ajustes en las variables principales de tiempo y coste por alternativa. Por tanto, en este sentido, mejora el proceso de decisión de viajeros y operado- res de carga, a partir del análisis detallado de la información de partida, en dicho proceso de participación pública Esto repercute posteriormen- te en el análisis multicriterio Analytic Hierarchy Process (AHP) de las alternativas, a partir de los factores principales de cada una, con sus pon- deraciones correspondientes aplicadas en el proceso de planificación. En el caso de estudio mostrado en concreto, a partir de las ton/año de ca- da alternativa se determinan los porcentajes de reparto observados reales 146 Caṕıtulo 5. Conclusiones 147 entre alternativas. Este valor es fundamental ya que determina las pro- babilidades de uso reales por sentido import/export, tipo de mercanćıa y par OD, para cada una de las combinaciones ID1 e ID2. El resulta- do es el porcentaje obtenido de la división de toneladas/año para cada combinación de las anteriormente indicadas, entre la suma total de car- ga por OD. En base a estos porcentajes, posteriormente se determinan los errores relativos y absolutos del Multi Nomial Logit, Red Neuronal y Red Bayesiana, lo que muestra la bondad en el ajuste de cada una de las técnicas utilizadas. Por tanto, a menor error obtenido, mejor ajuste para cada alternativa de transporte elegida por los operadores de carga, lo cual también se puede extrapolar a la decisión de los viajeros. Aśı, la minimización de los errores se puede transformar en unidades monetarias: 1) a partir del coste de cada alternativa de transporte, por lo que un me- jor ajuste en los errores implica una reducción en los costes individuales por alternativa, y por tanto, en el sumatorio del coste total del proyecto; 2) un mejor ajuste permite saber exactamente los ingresos obtenidos de cada elección de alternativa. Por tanto, se consigue un mejor ajuste en el ratio coste-beneficio; en cuanto a los objetivos a.2 (optimizar los mo- delos de transporte utilizados en planificación) y a.3 (comprobar que la aplicación de las aproximaciones bayesianas en la etapa de reparto modal supone obtener mejores resultados), si bien se han comprobado en este estudio, no se han podido comprobar con otros proyectos de esta enverga- dura (bioceánica) y corredores multimodales de transporte de mercanćıa a nivel mundial. La aplicación posterior de esta aproximación en proyectos similares o más pequeños permitirá comprobar la asunción de generalidad o no. El caso estudiado en el presente trabajo supone un primer paso para ello; el objetivo a.4 (promover las redes bayesianas en entornos complejos que ya son una realidad como son los Sistemas Inteligentes de Transporte (ITS), los Sistemas Cooperativos (V2V, V2I, V2I2V, I2I) de transporte e infraestructuras, y los veh́ıculos autónomos) podŕıa alcanzarse si las publi- caciones derivadas de la tesis tienen impacto en la comunidad interesada, entidades públicas y privadas, y en sus proyectos de planificación de in- Caṕıtulo 5. Conclusiones 148 fraestructuras. Ese el motivo para continuar y avanzar con esta ĺınea de investigación a futuro. b) Objetivos espećıficos: En cuanto a los objetivos b.1 (conseguir mejores re- sultados con menor cantidad de información), b.2 (disminuir los tiempos de procesamiento para el reparto modal) y b.4 (mejorar los algoritmos utilizados habitualmente), se consiguen teniendo en cuenta tres de los principales factores de la base matemática de las redes bayesianas: la re- lación entre los nodos de las variables padres y de las variables hijos, la estructura de dependencia probabiĺıstica entre ellas, y la posibilidad en cuanto a la utilización de información cualitativa y cuantitativa, hacen que los pesos de las variables aśı como los ajustes iterativos se optimicen con la información disponible a lo largo del tiempo en comparación con los otros métodos. Además de esto, los resultados obtenidos mediante la aproxima- ción bayesiana mejoran los obtenidos mediante los algoritmos habituales; en cuanto al objetivo b.3 (mejorar el ajuste coste-beneficio derivado de las mejoras aportadas por las RB en los resultados, cara a optimizar los recursos económicos existentes y conseguir financiación para los proyectos de infraestructura y transporte), también se consigue, ya que si bien el detalle de los costes de cada alternativa de transporte está sujeto a confi- dencialidad, minimizar los errores de elección de cada alternativa supone ajustar los costes y los beneficios derivados del uso de cada una, por lo que se mejora el ajuste de ambas cifras. La ficha descriptiva del proyecto correspondiente al COSIPLAN (Consejo Suramericano de Infraestructura y Planeamiento) de UNASUR (Unión de Naciones Suramericanas): http: //www.iirsa.org/proyectos/detalle_proyecto.aspx?h=1351, permi- te comprobar que es uno de los proyectos más importantes del IIRSA (Iniciativa para la Integración de la Infraestructura Regional Suramerica- na) con una inversión total de unos 7.000 millones de U$D. 2. En cuanto a los resultados obtenidos, a nivel general, por el momento no per- miten una generalización para modelos clásicos de cuatro etapas, de transporte de mercanćıas. Son espećıficos para este caso concreto, en el que se ha utiliza- do una RB en la etapa de reparto modal. Teniendo en cuenta, además, que la http://www.iirsa.org/proyectos/detalle_proyecto.aspx?h=1351 http://www.iirsa.org/proyectos/detalle_proyecto.aspx?h=1351 Caṕıtulo 5. Conclusiones 149 confidencialidad del uso de los mismos condiciona el detalle de las alternativas propuestas y por tanto, de los resultados mostrados. Al respecto, mencionar que en el caṕıtulo 4.3 se enumeran otros trabajos similares recientes sobre modelos de transporte como los de Sun et al. (2006), Correa et al. (2009), Tang et al. (2012), aplicando RB a modelos de transporte de veh́ıculo privado y pasajeros, Daziano et al. (2013), donde están contenidas las RB asociadas a la distribución multinomial, Yannis Tyrinopoulos (2013) y Tai Yu Ma (2015) donde pueden verse distribuciones más generales aplicadas a este tipo de redes, con resulta- dos igualmente prometedores. Sin embargo, todos ellos se focalizan en ámbitos de estudio urbanos o metropolitanos y de veh́ıculo privado, bien para analizar temas como: estimaciones de viajes de veh́ıculos privados (pasajeros); sistemas de peaje en autopistas; la seguridad vial, considerando los beneficios derivados del uso de modelos Markov Chain Monte Carlo (MCMC) y de los modelos ba- yesianos Empirical Bayes (EB) y Full Hierarchical Bayes (FHB); la movilidad en situaciones de congestión vehicular, con modelos Probit; o los patrones de movilidad urbana de los trabajadores (commuters y similares) de zonas fronte- ra metropolitanas, analizando cuáles son las principales variables que influyen en un modelo de reparto modal orientado a la promoción del transporte públi- co en detrimento del veh́ıculo privado. Por tanto, bajo esta consideración, si bien son similares en cuando a la orientación de la elección modal, difieren en cuanto a su uso hacia un modelo de transporte de mercanćıas como el indicado en el caso de estudio que se presenta, el cual además es un caso real. 3. La principal contribución original de este trabajo es el uso de una RB en la etapa de reparto modal de un modelo clásico de cuatro etapas, aplicado a un modelo multimodal de mercanćıas de ámbito mundial. 4. Por lo tanto, la realización de este trabajo permite afirmar la hipótesis inicial de partida: “las Redes Bayesianas son una mejor aproximación en los modelos de reparto modal, incluidos a su vez de modelos de transporte, que los habi- tualmente utilizados como los modelos Logit y Multinomial Logit, e incluso que las Redes Neuronales”. 5. En el caso concreto de un modelo de transporte de mercanćıas de ámbito Caṕıtulo 5. Conclusiones 150 mundial se ha verificado pese a la falta de evidencias iniciales y los resultados obtenidos han servido para apoyar dicho planteamiento. 6. Se demuestra la idea de que no todas las variables de una RB influyen de igual manera en la variable de interés. Es importante recalcar en este contexto, que el objetivo del procedimiento consiste en identificar entre las variables dispo- nibles, cuál o cuáles, intervienen más para disminuir la entroṕıa del objetivo, entendiendo esto como una disminución de la incertidumbre. 7. Los modelos de transporte son una poderosa herramienta para ayudar en la toma de decisiones relacionadas con las infraestructuras y las inversiones que un páıs ha de llevar a cabo a futuro, por lo que mejorar las estimaciones en este tipo de proyectos de infraestructura supone. 8. La utilización conjunta de algoritmos y métodos matemáticos con herramientas y tecnoloǵıas de modelización, aplicadas a la planificación de transportes a partir de la utilización de datos históricos o en tiempo real, es una realidad que se ha de imponer en los próximos años para la optimización de los recursos e infraestructuras, mejora del medio ambiente, del ahorro energético, reducción de la huella de carbono, lo que en general significa mejorar la calidad de vida de la población. 9. Tanto la definición y elección de los datos necesarios, como de la metodoloǵıa a aplicar son aspectos fundamentales que condicionan la información disponible y los posibles resultados a obtener. Éstos se tienen que ajustar a los objetivos planteados, de cara a conseguir la mayor precisión posible, siendo a su vez lo más realistas posibles. 10. Una optimización en la planificación, utilizando aproximaciones matemáticas novedosas, como es en este caso la aplicación de Redes Bayesianas, no sólo significa mejorar otros procedimientos si no avanzar en nuevas ĺıneas que son igual de consistentes desde el punto de vista teórico. 11. La reducción de los errores en los ajustes implica directamente una mejora en los recursos económicos de un páıs o entidad pública, de red o de servicio, Caṕıtulo 5. Conclusiones 151 que se establezcan en cada escenario. Es decir, existe una transformada de los datos emṕıricos a los aspectos económicos, lo que significa conseguir una monetización de las mejoras obtenidas. 12. Por lo tanto, los modelos matemáticos son fundamentales en la toma de deci- siones. En este caso, para calcular los posibles niveles de endeudamiento, finan- ciación exterior, establecimiento de las tarifas, tipos de veh́ıculo, condiciones de servicio, condiciones administrativas, necesidad de cambios normativos y legislativos que den soporte a los gobiernos, empresas y entidades, cambios en las poĺıticas sociales, etc. 13. La construcción de modelos configurables de transporte de pasajeros y mer- canćıas implica la posibilidad de analizar y evaluar sistemas multimodales de transporte teniendo en cuenta un número considerable de factores y variables, las cuales pueden presentar relaciones directas o indirectas. 14. La aplicación de la metodoloǵıa basada en un modelo de cuatro etapas permite, en el caso de estudio concreto de un posible corredor ferroviario entre Brasil y Perú (CFBC), obtener un modelo capaz de estimar las futuras captaciones de tráfico del ferrocarril respecto otros modos. 15. La herramienta desarrollada ha sido adoptada por la Unidad Técnica de Fe- rrocarriles (UTF) del Viceministerio de Transporte (VMT) como apoyo en la planificación de transporte, si bien, a d́ıa de hoy este proyecto se encuentra a la espera de cambios por la situación interna y mundial existente. 16. La implementación de un modelo de transporte en un software espećıfico (en este caso TransCAD) proporciona las siguientes ventajas: 17. Contar con una base de datos GIS adecuadamente estructurada con la infor- mación relevante del modelo. 18. Automatizar el proceso de ejecución del modelo de tal forma que personal con una formación básica en modelos de transporte pueda hacer uso de este. 19. Agilizar el análisis de escenarios y el reajuste de las previsiones a medida que se cuente con nuevos datos. Caṕıtulo 5. Conclusiones 152 20. Proporcionar información gráfica que facilite la interpretación de los resultados. 21. Se ha evidenciado el hecho teórico de que no todas las variables de una RB influyen de igual manera en la variable de interés, y en este caso concreto en las alternativas planteadas. 22. La aproximación bayesiana empleada permite comparar tanto las relaciones entre variables como el pese de cada una de ellas respecto de variables alterna- tivas, ya sea para la red inicialmente construida, o para otras redes distintas, en base a los datos y bondad de la información disponible. 23. Los avances algoŕıtmicos y de procesamiento de grandes cantidades de infor- mación están permitiendo que nuevas técnicas, como las Redes Bayesianas, se postulen como alternativas reconocidas, obteniéndose resultados prometedores. 24. La aplicación de diferentes tests, tanto el de Doornick-Hansen para aceptar o rechazar la hipótesis de Normalidad de la muestra de datos, como el trans- formacion Nonparanormal en el caso de rechazo de este supuesto, suponen un avance en la fase de análisis y depuración de la información de partida. Esto implica no solo conocer las funciones de distribución asociadas, si no la posi- bilidad de transformación en el caso de no cumplir el criterio de Normalidad, sin pérdida de variabilidad, lo cual se traduce en la posibilidad de utilización de las RBG. 25. En el caso del estudio descrito, los tres modelos de elección discreta emplea- dos (Logit Multinomial (MNL) – Red Neuronal (RN) – Red Bayesiana (RB)) permiten obtener estimaciones del reparto modal para el modelo de transporte construido. Lo cual implica cumplir un supuesto básico de partida. 26. Los resultados y ajustes obtenidos mediante la aplicación de Redes Bayesianas, en comparación con los modelos Logit Multinomiales y de Redes Neuronales, permite minimizar los errores a la hora de estimar las mejores alternativas de transporte entre los modelos de elección modal empleados. 27. En relación al MNL, son las siguientes: Caṕıtulo 5. Conclusiones 153 a) Principalmente, el valor del error medio cuadrado y el error máximo abso- luto para la conexión con el puerto de Arica por carretera son muy eleva- dos. Esto es peligroso ya que se ha demostrado que este puerto es una de las salidas más importantes de las exportaciones hacia el océano Paćıfico. Por tanto, desviaciones aśı repercuten en un mal dimensionamiento de los recursos e infraestructuras, y supone una mala planificación a futuro y unos condicionantes económicos y financieros de inversión mucho más elevados a largo plazo. b) En relación a la otra alternativa principal de salida, el puerto de Antofa- gasta, el error medio cuadrado obtenido está en unos valores razonables, si bien, los errores máximos absolutos son muy elevado, entre un 93 % y un 99,5 %, lo cual es peligros para las estimaciones futuras. c) Además, se suma el desconocimiento de las relaciones existentes de de- pendencia entre las variables significativas, que śı existen en las Redes Bayesianas. d) Las conclusiones de los anteriores gráficos a partir de las estimaciones del modelo obtenidas en la anterior tabla, tomando de ejemplo las exporta- ciones bolivianas por el océano Paćıfico: e) Situación base: la v́ıa principal de salida de la carga es la conexión hasta el puerto de Antofagasta y desde aqúı por v́ıa maŕıtima. Hasta este puer- to el tráfico llega en modo ferroviario. También se realizan salidas, pero menores, por Arica e Ilo, conectando por carretera. f ) Situación futura: con el corredor ferroviario funcionando al 100 %, éste se posiciona como un modo competitivo frente a la carretera, en costes y tiempos, para el transporte de mercanćıas. De esta forma, las mercanćıas se reparten entre Antofagasta y el puerto de Ilo. En este último caso se aprecia como el flujo de carga es mayor por ferrocarril que por carretera, con lo que el total de carga transportada aumenta respecto la situación base. g) Por tanto, las funciones de utilidad resultantes de la aplicación del MNL para calcular la elección modal son consistentes en la situación base, y Caṕıtulo 5. Conclusiones 154 por tanto, pueden ser usadas para las proyecciones de carga en situación futura. Esto es importante en la etapa de asignación a la hora de calcular las captaciones posibles en el corredor ferroviario. 28. En relación a la RN, considerando que no se han utilizado estos datos para realizar ninguna asignación a red ya que no es el objeto de este trabajo, son las siguientes: a) Inicialmente, un menor conocimiento de las relaciones entre las variables que śı podemos encontrar en el MNL y, sobre todo en las RB. Esto es aśı por en concepto de “caja negra” inherente a las RN, al interpretar las relaciones de las capas ocultas del perceptrón multicapa con las entradas y salidas. b) Se comprueba que no hay diferencias significativas en los resultados uti- lizando dos capas, y utilizando cuatro o seis, por lo que se opta por el modelo más sencillo con dos capas. c) En el caso del error máximo absoluto, sigue habiendo valores muy próxi- mos a 100 %, como es el caso de la conexión por ferrocarril con el puerto de Antofagasta, y las conexiones por carretera con los puertos de Arica, Ilo, Nuevapalmira, puerto Suárez, y Santos. Como se ha dicho en el caso anterior, estos porcentajes suponen un riesgo desde el punto de vista del cálculo de las elecciones modales, y, por tanto, las consecuencias derivadas para el proyecto en cuento al cálculo de las captaciones del ferrocarril, ya que supone un mal dimensionamiento de las necesidades futuras de infra- estructura. Eso implica desviaciones a su vez en los recursos necesarios para la operativa del servicio, para el cálculo de costes e ingresos, el coste total del proyecto y las necesidades o no de financiación. d) En relación al error medio cuadrado, los valores son muy similares a las estimaciones del MNL, si bien, mejora en el caso de la conexión por ca- rretera del puerto de Arica, pasado de un 73,71 % antes, a un 30,69 % en las RN. Este indicador también mejora para las conexiones ferroviarias del puerto de Arica, Iquique y Santos, alrededor de un 19 %, 5 % y 3,5 % respectivamente. Caṕıtulo 5. Conclusiones 155 29. En relación a la RB, considerando que no se han utilizado estos datos para realizar ninguna asignación a red ya que no es el objeto de este trabajo, son las siguientes: a) Se observa una precisión similar para los modelos de RN y RB, si bien la RB mejora ligeramente esta última a la RN en las alternativas más utili- zadas y con mayor flujo de mercanćıas: Arica por carretera, Antofagasta y Puerto Suárez. b) El MNL es, en general, el modelo con menor precisión, aunque ofrece la ventaja de que sus parámetros son fáciles de interpretar y comprender. c) A nivel global se aprecia que, en valor medio, la RB supera al MNL y a la RN. Ligeramente en el caso del error medio cuadrado de la RB respecto la RN, un 9,62 % contra un 10,96 %, y en mayor medida contra el MNL, un 17,92 %. Y de forma contundente en el caso del error máximo absoluto, un 46,22 % (RB) frente a un 72,02 % (RN), y un 78,42 % (MNL). d) De forma gráfica, igualmente se observa que la RB supera a los otros métodos en la mayoŕıa de los casos, especialmente en los más relevantes que son los indicados anteriormente: Arica por carretera, Antofagasta y Puerto Suárez. e) En este sentido, la figura de la RB obtenida nos da la relación entre las diferentes variables, por lo que su interpretación aporta más información que en el caso de las RN y MNL. Aśı, en el caso de las alternativas E1, E2, E3, E4, E6, E7, E10 y E12 las variables fundamentales son el precio FOB y la cantidad de toneladas transportadas (MTPA). Mientras que, en otras alternativas, E5, E8 y E11 (modo únicamente carretero), predo- mina el Coste asociado, bien de la propia alternativa, bien de un tramo común de otra en competencia. En el caso de los Tiempos de transpor- te, éstos dependen de tiempos de tramos igualmente en competencia, o de subtramos de alternativas mayores para el mismo modo de transpor- te (ferrocarril o carretera). Los Tiempos, a su vez, influyen en los costes totales de transporte, teniendo en cuenta la transformada monetaria de los mismos dependiendo de la utilización de un determinado número de Caṕıtulo 5. Conclusiones 156 recursos. Y en algunos casos, los costes derivan en un mayor o menor tiem- po en el empleo de una u otra alternativa. Como ejemplo, el tiempo de la alternativa T1 (Arica carretera) influye en los costes de las alternativas C4 (Ilo carretera) y C8 (Arica ferroviaria), condicionado por la conexión existente en estos puertos por carretera y ferrocarril; y por otro lado, el coste de la alternativa C6 (Santos carretera), influye directamente en el tiempo de transporte T1 (Arica carretera), evidentemente, al ser el tramo de transporte más extenso de toda la red, entre la costa del Atlántico y la costa del Paćıfico, habida cuenta de la desconexión ferroviaria actual entre la red andina y la red oriental en el tramo boliviano. f ) La RB y el MNL permiten interpretar los parámetros resultantes. La RN en menor medida por el efecto “caja negra” mencionado en relación a las capas ocultas del modelo multicapa. g) Queda demostrado aśı que la aproximación bayesiana en el ajuste de las estimaciones de la elección modal, para las alternativas planteadas en este modelo, es mejor y más precisa, que en el caso de las técnicas clásicas del MNL y algo más recientes de las RN, tanto en base al error cuadrático medio como a los errores máximos de ajuste. 30. En definitiva, se han respondido a las preguntas clave formuladas durante el desarrollo del trabajo: a) ¿Cuáles son las contribuciones originales del trabajo? El uso de las redes bayesianas en la etapa de reparto modal de un modelo de transportes (clásico de cuatro etapas) de mercanćıas, multimodal, a nivel mundial, confirmando que los resultados obtenidos son mejores que los obtenidos con otras técnicas más habituales, como los modelos multinomial logit (MNL) y las redes neuronales (RN). b) ¿Cuál es su naturaleza? La definición de la temática y el planteamiento del problema de investigación centran el estudio en la planificación de las infraestucturas a futuro. En este caso concreto, de una infraestructura multimodal con relaciones a todos los niveles posibles: distritales, regio- nales, estatales y continentales. El desarrollo de la perspectiva teórica se Caṕıtulo 5. Conclusiones 157 basa en las Redes Bayesianas, en la definición, tipoloǵıa y aplicación de las mismas, considerando sus principales caracteŕısticas y propiedades. La re- colección, análisis e interpretación de los datos toma de referencia un caso práctico de estudio, un corredor ferroviario que una el océano Atlántico con el océano Paćıfico, prioritariamente para el transporte de mercanćıas. Siendo las variables principales en la elección de las alternativas de trans- porte multimodal las de tiempo y coste, la naturaleza de la investigación es meramente cuantitativa. Si bien, la posibilidad de incluir otro tipo de va- riables cualitativas hace más extensa esta naturaleza inicial. La estrategia metodológica se basa en la comparativa de los resultados obtenidos para las distintas alternativas de transporte, en cuanto a la elección del modo de transporte (reparto modal), en el modelo de transportes construido a tal efecto. Las metas del estudio, finalmente, han sido las de comprobar que los resultados obtenidos con las redes bayesianas son mejores que las obtenidas con otros métodos habituales, los multinomial logit (MNL) y las redes neuronales (RN). c) ¿Cuál es su alcance? a) macroscópico, como es el caso de estudio presen- tado, pudiéndose aplicar de forma añadida tanto a la etapa (1) de genera- ción-atracción, como a la etapa (2) de distribución de viajes (transformada de la matriz de generación-atracción a la matriz de origen-destino median- te una función de impedancia). El siguiente paso, lógico, de la presente investigación precisamente va en ĺınea con la implementación de este tipo de redes bayesianas en tres de las cuatro etapas de un modelo de mer- canćıas. b) microscópico, en los modelos de tráfico de ámbito más urbano o interurbano, pudiéndose aplicar a los modelos de elección de ruta o seguimiento vehicular, inicialmente. d) ¿Cuáles son sus limitaciones? La principal limitación es, hasta el momento, la inexistencia de proyectos similares de transporte de mercanćıas en el que se hayan podido replicar el uso de redes bayesianas al reparto modal, que verifiquen que los resultados obtenidos en este caso. Igualmente, la difusion de las redes bayesianas como herramientas de aplicación en los proyectos de planificación de infraestructura todav́ıa tiene un margen de Caṕıtulo 5. Conclusiones 158 penetración en las entidades públicas y empresas de ingenieŕıa, por lo que a d́ıa de hoy su uso no está muy extendido. 31. Estos resultados abren una nueva ĺınea de aplicación para las RB en los pro- blemas de elección modal en transporte. Por un lado, ofrecen posibilidades interesantes en cuanto al establecimiento de relaciones de causalidad entre las variables del problema y por otro lado, los resultados en este caso en particular, muestran que las RB ofrecen un gran potencial para ser más precisas que los modelos clásicos de reparto modal que se han venido utilizando hasta la fecha. Caṕıtulo 6 Futuras ĺıneas de investigación A continuación, se muestran algunas de las principales ĺıneas de investigación que pueden derivarse del presente trabajo con Redes Bayesianas: 1. Mejora de los modelos macroscópicos de 4 etapas en las otras etapas en fase de estudio, fundamentalmente la etapa 1-Generación-Atracción y la etapa 2- Distribución 2. Mejora de los algoritmos de seguimiento vehicular en los modelos microscópicos e h́ıbridos de simulación de tráfico, partiendo de datos obtenidos en tiempo real de los centros de control. 3. Optimización en las técnicas matemáticas empleadas en los modelos de eventos discretos, en relación al tratamiento de las longitudes máxima de cola y los servidores de, mejorando los tiempos en los servicios. Un ejemplo claro son las terminales portuarias en las que la optimización del stockage es fundamental para garantizar los tiempos y recursos necesarios. 4. Sistemas Expertos aplicados al COVID19. Un ejemplo es el desarrollado en el grupo de trabajo /investigación MATGEN del CEMAT, dentro de la iniciativa de Acción Matemática contra el Coronavirus. Se está trabajando en un sistema experto con metodoloǵıa bayesiana y big data para la detección de puntos de inflexión en series temporales aplicación a las series de datos del covid-19 (http://matematicas.uclm.es/cemat/covid19/). EOI sobre el SARS-COV- 2 y la enfermedad COVID19 - (Unión Europea+Instituto de salud Carlos III). 159 http://matematicas.uclm.es/cemat/covid19/ Caṕıtulo 6. Futuras ĺıneas de investigación 160 5. Mejora de las técnicas aplicadas en Digital Humanities (interpretación de lega- jos manuscritos anteriores al siglo XIX) en el procesamiento de la información obtenida de imágenes de alta resolución. 6. Sistemas Inteligentes de Transporte (ITS) aplicados a Transporte Público y Privado y Sistemas Cooperativos veh́ıculo-infraestructura (V2V, V2I, V2I2V, I2I), en cuanto a la mejora de los algoritmos utilizados entre ambos “objetos” en tiempo real. Supone un gran reto de cara a la implantación de los sistemas 5G de comunicación y la sensorización total de las ciudades y extensión de las Smart Cities. 7. Big Data y Soft Data aplicados al transporte multimodal e intermodal (viario, portuario, aéreo) de mercanćıas, de cara a una adecuada planificación de las infraestructuras, poĺıticas tarifarias y de costes. 8. Modelos de Transporte con Veh́ıculos de conducción Autónoma, RPAS (drones) y sistemas robóticos. 9. Redes sociales, redes de telecomunicación, redes de abastecimiento y distribu- ción (electricidad, agua, gas. . . ) en cuanto al ajuste de los modelos de consumo y de demanda. 10. Innovación en redes eléctricas de recarga urbana e interurbana de veh́ıculos, tanto en entornos residenciales como comunitarias, bien por suministro directo en punto fijo como inducido de forma dinámica. Un ejemplo son los sistemas de recarga por oportunidad en cabeceras aplicados a sistemas BRT (Bus Rapid Transit) con pantógrafos. 11. Modelos genéticos, modelos tumorales, innovación médica. Mejora en los algo- ritmos de diagnóstico de imágenes tumorales, comparando las Redes Bayesianas con las Redes Neuronales estándar y convolucionales recientemente aplicadas en enfermedades degenerativas, como el Alzheimer. Al respecto, entre los proyectos europeos actuales relacionados con la movilidad cabe destacar: C-Roads Spain, Bamboo, Levitate y Momentum, los cuales se están desarrollando o se van a desarrollar con el horizonte 2022. Caṕıtulo 6. Futuras ĺıneas de investigación 161 1. (https://intercor-project.eu/homepage/c-roads/) C-ROADS: Platafor- ma Abierta para mejorar la conectividad europea de los ITS (Connecting Eu- rope Facility (CEF)) C-ITS 2. BAMBOO: Big Data Analytics for Mobility Modelling (https://www.eurostars-eureka.eu/project/id/12063, https://www.era-learn.eu/network-information/networks/eurostars-2/ eurostars-cut-off-8/big-data-analytics-for-mobility-modelling) 3. LEVITATE: Societal Level Impacts of Connected and Automated Vehicles (levitate-project.eu) 4. (https://cordis.europa.eu/project/rcn/221856/factsheet/en) MOMEN- TUM: Proyecto para modelizar soluciones emergentes de transporte en ciuda- des de la UE: tecnoloǵıas disruptivas, MaaS, CAVs (connected and autonomous vehicles). A estos proyectos, también hay que añadir los que se están desarrollando en Reino Unido orientados a los veh́ıculos autónomos y conectados (CAVs), entre los que destacan: Flourish y Human Drive. 1. FLOURISH: (http://www.flourishmobility.com/) 2. HUMAN DRIVE: (https://humandrive.co.uk/) https://intercor-project.eu/homepage/c-roads/ https://www.eurostars-eureka.eu/project/id/12063 https://www.era-learn.eu/network-information/networks/eurostars-2/eurostars-cut-off-8/big-data-analytics-for-mobility-modelling https://www.era-learn.eu/network-information/networks/eurostars-2/eurostars-cut-off-8/big-data-analytics-for-mobility-modelling https://cordis.europa.eu/project/rcn/221856/factsheet/en http://www.flourishmobility.com/ https://humandrive.co.uk/ Caṕıtulo 7 Bibliograf́ıa 1. Aho, K. (2014). asbio: A Collection of Statistical Tools for Biologists. Con- tains functions from: Foundational and Applied Statistics for Biologists using R, (https://cran.r-project.org/web/packages/asbio/index.html). CRC/Taylor and Francis, Boca Raton, FL 2. Aldrich, J.A., Nelson, F.D. and Adler, E.S. (1984.). Linear Probability, Logit, and Probit Models. Sage Publications, inc. 3. Anderson, T.W. (2003). An introduction to multivariate statistical analysis (3rd ed.). Wiley-Interscience. 4. Bayes, T.; Price, Mr. (1764). An Essay towards solving a Problem in the Doc- trine of Chances. Philosophical Transactions of the Royal Society of London 53: 370–418. doi:10.1098/rstl.1763.0053 5. Berge, C. (1973). Graphs and Hypergraphs. Amsterdam: North-Holland. 6. Bowman, K.O. and Shenton, L.R. (1975). Omnibus test contours for departures from normality based on √ b1 and b2. Biometrika, vol 2, 103-117. 7. Bromley, J. (2005). Guidelines for the use of Bayesian networks as a participa- tory tool for Water Resource Management. Centre for Ecology and Hydrology, C01704, 117. 162 Caṕıtulo 7. Bibliograf́ıa 163 8. Castillo, E., Gutiérrez, J.M. y Hadi, A.S. (1997). Expert Systems and Probabi- listic Network Models. Springer Verlag. 9. Castillo, E. y Kjærulff, U. (2003). Sensitivity analysis in Gaussian Bayesian networks using a symbolic-numerical technique. Reliability Engineering and System Safety, 79, 139-148. 10. Clancey, W.J. (1993). Notes on Heuristic classification. Artificial Intelligence, 59: 191-196. 11. Cobb, B.R., Rumı́, R. and Salmerón, A. (2007). Bayesian networks models with discrete and continuous variables. Advances in Probabilistic Graphical Models, Studies in Fuzziness and Soft Computing. Springer 81-102. 12. Correa, M., Bielza, C., Pamies-Teixeira, J. (2009). Comparison of Bayesian networks and artificial neural networks for quality detection in a machining process. Expert Systems with Applications, Volume 36, Issue 3, Part 2, Pages 7270-7279, ISSN 0957-4174. DOI.org/10.1016/j.eswa.2008.09.024. 13. Cowell, R. G., Dawid, A. P., Lauritzen, S. L. y Spiegelhalter, D. J. (1999). Probabilistic Networks and Expert Systems. Springer, Barcelona. 14. Cowell, R. G. (2005). Local Propagation in Conditional Gaussian Bayesian Networks. Journal of Machine Learning Research, 6, 1517-1550. 15. Daly, A., Zachary, S., Hensher , D. and Dalvi , Q. (1978). Improved multiple choice models. 16. DÁgostino, R. B. (1970). Transformation to normality of the null distribution of g1. Biometrika, 57, 679-681. 17. Daziano, R., Miranda-Moreno, L. & Shahram Heydari (2013). Computational Bayesian Statistics in Transportation Modelling: From road Safety Analysis to Discrete Choice, Transport Reviews, Vol. 33. 18. Dean, T. y Wellman, M. (1991). Planning and Control. San Mateo, California: Morgan Kaufmann. Caṕıtulo 7. Bibliograf́ıa 164 19. Doornik, J.A. and Hansen, H. (2008). An Omnibus Test for Univariate and Multivariate Normality. Oxford Bulletin of Economics and Statistics, 70, 927- 939 20. Golumbic, M. C. (1980). Algorithmic Graph Theory and Perfect Graphs. Lon- don: Academic Press. 21. Gómez-Villegas, M.A., Máın, P. y Susi, R. (2006). Sensitivity analysis of ex- treme inaccuracies in Gaussian Bayesian Networks. Proceedings of the Third European Workshop on Probabilistic Graphical Models, Prague, Czech Repu- blic, pp. 139-146. 22. Gomez-Villegas, M.A., Main, P. and Susi, R. (2007). Sensitivity analysis in Gaussian Bayesian networks using a divergence measure. Communications in Statistics- Theory and Methods, vol 36, 523-539. 23. Gómez-Villegas, M.A., Máın, P. y Viviani, P. (2014). Sensitivity to evidence in Gaussian Bayesian networks using mutual information. Information sciences 275, 115-126 24. Gómez-Villegas, M.A., González- Pérez, B., De Gregorio Vicente, O (2019). Redes bayesianas aplicadas a la nueva movilidad mundial. XXXVIII Congre- so Nacional de Estad́ıstica e Investigación Operativa y las XII Jornadas de Estad́ıstica Pública. 25. Hensher, D.A. and Ton, T.T. (2000). A comparison of the predictive potential of artificial neural networks and nested logit models for commuter mode choice. Transportation Research Part E: Logistics and Transportation Review. Volume 36, Issue 3, September 2000, Pages 155-172. 26. Karlaftis, M.G. and Vlahogianni, E.I. (2011); Statistical methods versus neural networks in transportation research: Differences, similarities and some insights. Transportation Research Part C: Emerging Technologies. Volume 19, Issue 3, June 2011, Pages 387-399 Caṕıtulo 7. Bibliograf́ıa 165 27. Nijkamp, P., Reggiani, A., Tsang, W.F. ., (2004). Comparative modelling of in- terregional transport flows: Applications to multimodal European freight trans- port. European Journal of Operational Research. Volume 155, Issue 3, 16 June 2004, Pages 584-602 28. Holland, A. (2003). Bayesian networks for transport decision scenarios. Dpt. Computer Science, University of Dortmund. 29. Horn, Mark E.T. (2003). An extended model and procedural framework for planning multi-modal passenger journeys. Transportation Research Part B 37, pp. 641-660 30. Jensen, F.V. (2001) Bayesian Networks and Decision Graphs. Barcelona. Sprin- ger 31. Korb, K., Nicholson, A. (2004). Bayesian Artificial Intelligence. Boca Ratón, FL: Chapman and Hall 32. Lafferty, J., Liu, H. and Wasserman, L. (2012). Sparse nonparametric graphical models. Statistical Science, 27, 519-537. 33. Lancaster, K. J. (1966). A New Approach to Consumer Theory. J. Polit. Econ., vol. 74, no. 2, pp. 132–157, Apr. 1966. 34. Lauritzen, S. L., Dawid, A. P., Larsen, B. N. y Leimer, H. G. (1990). Indepen- dence Properties of Directed Markov Fields. Networks. 20, 491—505. 35. Lauritzen, S. L. (1992). Propagation of probabilities, means and variances in mixed graphical association models. Journal of the American Statistical Asso- ciation, 87, 1098-1108. 36. Lauritzen, S. L. (1996). Graphical Models. Oxford: Clarendon Press. 37. Lauritzen, S. L. y Jensen, F. (2001). Stable local computation with conditional Gaussian distributions. Statistics and Computing, 11, 191—203. 38. Lippman, R.P. (1987). An Introduction to Computing with Neural Nets. IEEE ASSP Magazine 4, 4-22. Caṕıtulo 7. Bibliograf́ıa 166 39. Liu, H., Lafferty, J. and Wasserman, L. (2009). The Nonparanormal: Semipara- metric estimation of high dimensional undirected graphs. J. Mach. Learn. Res. 10, 2295-2328. MR2563983 40. Moral, S., Rumı́, R., Salmerón, A. (2001). Mixtures of truncated exponentials in hybrid Bayesian networks. Lecture Notes in Artificial Intelligence, Vol. 2143, pp.135-143. 41. Neapolitan, Richard E. (1989). Probabilistic reasoning in expert systems: theory and algorithms. Wiley. ISBN 978-0-471-61840-9 42. Neapolitan, R.E. (2004). Learning Bayesian Networks. Prentice Hall. 43. Nogal-Macho, M. (2011). Métodos matemáticos para la predicción de tráfico. ISBN: 978-84-86116-55-2. 44. Normand, S.L. y Tritchler, D. (1992). Parameter Updating in Bayes Network. Journal of the American Statistical Association, 87, 1109—1115. 45. Novikoff, A.B. (1962). On convergence proofs on perceptrons. Symposium on the Mathematical Theory of Automata (pp. 615-622). Polythecnic Institute of Brooklyn. 46. Ortúzar, J., y Willumsen, L. G. (1995). Modelos de Transporte. Universidad de Chile. 47. Ortúzar, J.D., y Willumsen, L. G. (2011). Modelling Transport. Edited by John Wiley&Sons. 4th ed. Chichester, West Sussex. 48. Pearl, J. (1985). Bayesian Networks: A Model of Self-Activated Memory for Evidential Reasoning (UCLA Technical Report CSD-850017). Proceedings of the 7th Conference of the Cognitive Science Society, University of California, Irvine, CA. pp. 329–334 49. Pearl, J. (1986). A constraint-propagation approach to probabilistic reasoning. Proceedings of American Association for Artificial Intelligence National Con- ference on AI, Pittsburgh, Pennsylvania, pp. 133-136. Caṕıtulo 7. Bibliograf́ıa 167 50. Pearl, J (1988). Probabilistic Reasoning in Intelligent Systems. San Francisco CA: Morgan Kaufmann. p. 1988. ISBN 1558604790 51. Riedmiller M. and Braun H. (1993). A direct adaptive method for faster back- propagation learning: The RPROP algorithm. Proceedings of the IEEE Interna- tional Conference on Neural Networks (ICNN), pages 586-591. San Francisco. 52. Russell, SJ., Norvig, P. (2009). Artificial Intelligence: A Modern Approach. Bocaratón, FL: Prentice Hall, 3rd edition. 53. Rios-Prado, R., Crespo-Pereira, D., Del Rio-Vilas , D., Rego-Monteil , N., and De Gregorio-Vicente, Ó. (2013). Model development for the assessment of an international railway corridor – methodological overview. Proceedings 15th International Conference on Harbor, Maritime and Multimodal Logistics Modelling and Simulation, pp. 133–139. 2013. 54. Salinas R. (2013). Reunin Regional preparatoria de la Conferencia de Exmen Global Decenal de la Ejecucin del Programa de Accin de Almaty. Recuperado de: https://slideplayer.es/slide/2763492/ 55. Sánchez-Cambronero Garćıa-Moreno, S. (2008). Traffic prediction models using bayessian networks and other tools. 56. Scutari, M. y Denis, J.B. (2015). Bayesian Networks, with examples in R. CRC Press, Taylor & Francis group. A Chapman & Hall book, pp. 37-52. 57. Shenton, L.R. and Bowman, K.O. (1977). A bivariate model for the distribution of √ b1 and b2. Journal of the American Statistical Association, vol 72, 206-211. 58. Sun, S., Zhang, Ch. and Yu, G., (2006). A bayesian network approach to traffic flow forecasting. IEEE Transactions on Intelligent Transportation Systems, vol. 7, no. 1, pp. 124-132. DOI: 10.1109/TITS.2006.869623. 59. Sklar, M. (1959). Fonctions de répartition a n dimensions et leurs marges. Publ. Inst. Statist. Univ. Paris 8 229-231. MR0125600 https://slideplayer.es/slide/2763492/ Caṕıtulo 7. Bibliograf́ıa 168 60. Spear, B.D. (1977). Applications of new travel demand forecasting techniques to transportation planning: a study of individual choice models. Washington D.C. : Federal Highway Administration, U.S. Department of-Transport, Office of Highway Planning. 61. Tai-Yu, M. (2015). Bayesian Networks for Multimodal Mode Choice Behavior Modelling: A Case Study for the Cross Border Workers of Luxembourg. Trans- portation Research Procedia, vol. 10, pp. 870-880. 62. Tang, D. N., Yang, M., & Zhang, M. H. (2012). Travel Mode Choice Mo- deling: A Comparison of Bayesian Networks and Neural Networks. Applied Mechanics and Materials, 209–211, 717–723. https://doi.org/10.4028/www. scientific.net/amm.209-211.717. 63. Tsamardinos, I., Aliferis, C. F. and Statnikov, A. (2003). Time and sample eficiente discovery of Markov blankets and direct causal relations. Ninth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pp. 673-678. 64. Tsamardinos, I., Brown, LE., Aliferis, CF. (2006). The max-min hill-climbing Bayesian network structure learning algorithm. Machine Learning, 65:31-78. 65. Viviani Garćıa, P., Gómez-Villegas, M.A., Máın-Yaque, P. (2014). Análisis de sensibilidad a la evidencia en Redes Bayesianas Gausianas. 66. Weidl, G., Madsen, A. L., Wang, S., Kasper, D. y Karlsen, M., Early and Accurate Recognition of Highway Traffic Maneuvers Considering Real World Application: A Novel Framework Using Bayesian Networks. IEEE Intelligent Transportation Systems Magazine, vol. 10, no. 3, pp. 146-158, Fall 2018, doi: 10.1109/MITS.2018.2842049. 67. Williams, H. C. W. L. (1977). On the formation of travel demand models and economic evaluation measures of user benefit. Environ. Plan. A, vol. 9, no. 3, pp. 285–344. https://doi.org/10.4028/www.scientific.net/amm.209-211.717 https://doi.org/10.4028/www.scientific.net/amm.209-211.717 Caṕıtulo 7. Bibliograf́ıa 169 68. Wilson, E. B. and Hilferty, M. M. (1931). The distribution of chi-square. Pro- ceedings of the National Academy of Sciences of the United States of America, 17, 684-688. 69. Yannis Tyrinopoulos, Constantinos Antoniou (2013). Factors affecting modal choice in urban mobility. European Transport Research Review, Volume 5,Issue 1, pp 27–39. 70. Zhao, T., Liu, H., Roeder, K., Lafferty, J. and Wasserman, L. (2012). The huge package for high-dimensional undirected graph estimation in R. The Journal of Machine Learning Research, 98888:1059-1062. R package. http://cran.rproject.org/web/packages/huge/index.html http://cran.rproject.org/web/packages/huge/index.html Apéndice A Muestra de la Base de Datos Si bien los datos originales no pueden ser accesibles por razones de confidenciali- dad asociadas al Caso de Estudio, una muestra de los datos utilizados en el presente trabajo puede descargarse de la siguiente dirección personal: http://www.mat.ucm. es/~villegas/miembro-cv-oscar.html. El fichero generado está protegido, por lo que se deberá solicitar el permiso correspondiente para su utilización. 170 http://www.mat.ucm.es/~villegas/miembro-cv-oscar.html http://www.mat.ucm.es/~villegas/miembro-cv-oscar.html Apéndice B DATASET ELECCION MODAL A continuación, se incluye una muestra procedente del archivo de datos “Dataset Elección Modal” para observar su estructura. 171 Apéndice B. DATASET ELECCION MODAL 172 F ig u ra B .1 : D A T A S E T E L E C C IO N M O D A L Apéndice C RDATASET: DATASET A continuación, se incluye una muestra de los datos procedentes del fichero Excel “Dataset Eleccion Modal”, normalizados al rango (-50, 800) en el caso de los tiempos, y al rango (-50, 500) en el caso de los costes. Este fichero contiene los siguientes grupos de columnas en orden de izquierda a derecha: 1. Encabezados gris: tipos de mercanćıa / ID por OD, precio FOB, TMPA. 2. Encabezados azul: incremento en tiempo respecto a la mejor alternativa. 3. Encabezados naranja: Incremento en coste respecto a la mejor alternativa. 4. Encabezados azul: incremento en tiempo respecto a la mejor alternativa, nor- malizado al rango (-50, 800). 5. Encabezados naranja. incremento en coste respecto a la mejor alternativa nor- malizado al rango (-50, 500). 6. Encabezado azul oscuro. Porcentajes de reparto modal (valor fundamental para realizar la comparativa entre los distintos métodos MNL, RN y RB. 173 Apéndice C. RDATASET: DATASET 174 F ig u ra C .1 : R D A T A S E T : D A T A S E T Apéndice D RDATASET: DATANORM A continuación, se incluye una muestra procedente del archivo de datos para observar su estructura. 175 Apéndice D. RDATASET: DATANORM 176 F ig u ra D .1 : R D A T A S E T : D A T A N O R M Apéndice E MACRO: R Red Neuronal.R #Red Neuronal #Leo la tabla de datos de elección modal elecmod <- read.delim(Ç:/R/rrnn/elecmod.txt”) #Modelo de la RRNN ffff <- E1+E2+E3+E4+E5+E6+E7+E8+E9+E10+E11+E12 ∼ FOBPrice+MTPA+T1+T2+T3+T4+T5+T6+T7+T8+T9+T10+T11+T12+T13+T14+ C1+C2+C3+C4+C5+C6+C7+C8+C9+C10+C11+C12+C13+C14 elecmod$random <- runif(456) #Muestra de ajuste: 80 % de la muestra trainset <- subset(elecmod, random <= 0.8) tt <- trainset computeSet <- data.frame(FOBPrice = elecmod$FOBPrice, MTPA = elecmod$MTPA, T1 = elecmod$T1, T2 = elecmod$T2, T3 = elecmod$T3, T4 = elecmod$T4, T5 = elecmod$T5, T6 = elecmod$T6, T7 = elecmod$T7, T8 = elecmod$T8, T9 = elecmod$T9, T10 = elecmod$T10, T11 = elecmod$T11, T12 = elecmod$T12, T13 = elecmod$T13, T14 = elecmod$T14, C1 = elecmod$C1, C2= elecmod$C2, C3 = elecmod$C3, C4 = elecmod$C4, C5 = elecmod$C5, C6 = elecmod$C6, C7 = elecmod$C7, C8 = elecmod$C8, C9 = elecmod$C9, C10 = elecmod$C10, C11 = elecmod$C11, C12 = elecmod$C12, C13 = elecmod$C13, C14 = elecmod$C14, E1 = elecmod$E1, E2 = elecmod$E2, E3 = elecmod$E3, E4 = elecmod$E4, E5 = elecmod$E5, E6 = elecmod$E6, E7 = elecmod$E7, E8 = elecmod$E8, E9 = elecmod$E9, E10 = elecmod$E10, E11 = elecmod$E11, E12 = elecmod$E12) computeSet$random <- runif(456) trainset <- subset(computeSet, random <= 0.8) computeSet2 <- computeSet[, 1:30] #Ajuste de los modelos de redes nn2 <- neuralnet(ffff, trainset, hidden= c(2), rep=1, lifesign = ”full”, stepmax=1e6, threshold = 0.01) rr <- compute(nn2, computeSet2) write.table(netSol$response, Ç:\\R\\rrnn\\netSol2.txt”) nn4 <- neuralnet(ffff, trainset, hidden= c(4), rep=1, lifesign = ”full”, stepmax=1e6, threshold = 0.01) rr <- compute(nn4, computeSet2) write.table(netSol$response, Ç:\\R\\rrnn\\netSol4.txt”) nn6 <- neuralnet(ffff, trainset, hidden= c(6), rep=1, lifesign = ”full”, stepmax=1e6, threshold = 0.01) rr <- compute(nn6, computeSet2) write.table(netSol$response, Ç:\\R\\rrnn\\netSol6.txt”) 177 Apéndice F MACRO: Trainnet.R library(neuralnet) #Leo la tabla de datos de elección modal elecmod <- read.delim(Ç:/R/rrnn/elecmod.txt”) #Modelo de la RRNN ffff <- E1+E2+E3+E4+E5+E6+E7+E8+E9+E10+E11+E12 ∼ FOBPrice+MTPA+T1+T2+T3+T4+T5+T6+T7+T8+T9+T10+T11+T12+T13+T14+ C1+C2+C3+C4+C5+C6+C7+C8+C9+C10+C11+C12+C13+C14 elecmod$random <- runif(456) #trainset <- subset(elecmod, random <= 0.8) #tt <- trainset computeSet <- data.frame(FOBPrice = elecmod$FOBPrice, MTPA = elecmod$MTPA, T1 = elecmod$T1, T2 = elecmod$T2, T3 = elecmod$T3, T4 = elecmod$T4, T5 = elecmod$T5, T6 = elecmod$T6, T7 = elecmod$T7, T8 = elecmod$T8, T9 = elecmod$T9, T10 = elecmod$T10, T11 = elecmod$T11, T12 = elecmod$T12, T13 = elecmod$T13, T14 = elecmod$T14, C1 = elecmod$C1, C2= elecmod$C2, C3 = elecmod$C3, C4 = elecmod$C4, C5 = elecmod$C5, C6 = elecmod$C6, C7 = elecmod$C7, C8 = elecmod$C8, C9 = elecmod$C9, C10 = elecmod$C10, C11 = elecmod$C11, C12 = elecmod$C12, C13 = elecmod$C13, C14 = elecmod$C14, E1 = elecmod$E1, E2 = elecmod$E2, E3 = elecmod$E3, E4 = elecmod$E4, E5 = elecmod$E5, E6 = elecmod$E6, E7 = elecmod$E7, E8 = elecmod$E8, E9 = elecmod$E9, E10 = elecmod$E10, E11 = elecmod$E11, E12 = elecmod$E12) #Muestra de ajuste: 80 % de la muestra computeSet$random <- runif(456) trainset <- subset(computeSet, random <= 0.8) crossValSet <- subset(computeSet, random > 0.8) computeSet2 <- computeSet[, 1:30] crossValSet2 <- crossValSet[, 1:30] #Ajuste de los modelos de redes nn2 <- neuralnet(ffff, trainset, hidden= c(2), rep=1, lifesign = ”full”, stepmax=1e6, threshold = 0.01) rr <- compute(nn2, crossValSet2) write.table(nn2$response, Ç:\\R\\rrnn\\netSol2.txt”) nn4 <- neuralnet(ffff, trainset, hidden= c(4), rep=1, lifesign = ”full”, stepmax=1e6, threshold = 0.01) rr <- compute(nn4, computeSet2) write.table(netSol$response, Ç:\\R\\rrnn\\netSol4.txt”) nn6 <- neuralnet(ffff, trainset, hidden= c(6), rep=1, lifesign = ”full”, stepmax=1e6, threshold = 0.01) rr <- compute(nn6, computeSet2) write.table(netSol$response, Ç:\\R\\rrnn\\netSol6.txt”) 178 Apéndice G MACRO: R Red Bayesiana.R #Redes Bayesianas library(bnlearn) #Test previos y normalización de la muestra dh <- DH.test(computeSet,Y.names=names(computeSet)) tt <- DH.test(computeSet) C <- huge.npn(computeSet) C <- as.data.frame(C) tt <- DH.test(C) tt #Ajuste de la red bayesiana rbg <- mmhc(C, blacklist = blackl) bns <- arc.strength(rbg, C) bns <- boot.strength(C) bnf <- bn.fit(rbg, C) bnstruct <- bn.net(bnf) #Generacion de la muestra con las predicciones pp1 <- predict(bnf, .E1”, C) pp <- as.data.frame(pp1) pp$pp1 <- pp$pp1 - C$E1 pp2 <- predict(bnf, .E2”, computeSet) pp$E2 <- pp2 - C$E2 pp3 <- predict(bnf, .E3”, computeSet) pp$E3 <- pp3 - C$E3 pp4 <- predict(bnf, .E4”, computeSet) pp$E4 <- pp4 - C$E4 pp$E5 <- predict(bnf, .E5”, computeSet) - C$E5 pp$E6 <- predict(bnf, .E6”, computeSet) - C$E6 pp$E7 <- predict(bnf, .E7”, computeSet) - C$E7 pp$E8 <- predict(bnf, .E8”, computeSet) - C$E8 pp$E9 <- predict(bnf, .E9”, computeSet) - C$E9 pp$E10 <- predict(bnf, .E10”, computeSet) - C$E10 pp$E11 <- predict(bnf, .E11”, computeSet) - C$E11 pp$E12 <- predict(bnf, .E12”, computeSet) - C$E12 write.table(pp, Ç:\\R\\rrnn\\rby.txt”) 179 Portada declaracion Indice general tesis Agradecimientos Resumen Abstract Prólogo Conceptos fundamentales Fundamentos de la Teoría de Grafos Antecedentes históricos Conceptos básicos de Grafos Tipos de Grafos Grafos dirigidos Otras estructuras gráficas Probabilidad e independencia Probabilidad condicionada Independencia Independencia condicionada Independencia condicionada en variables aleatorias Propiedades de la independencia condicionada en variables aleatorias D-separación y evidencia Redes Bayesianas (RB) Antecedentes Definición y propiedades Tipología y aplicaciones Redes bayesianas discretas (RBD) Redes bayesianas gaussianas (RBG) Redes bayesianas mixtas (RBM) Aplicaciones Redes Bayesianas Gaussianas (RBG) Construcción de una RBG Independencia e Independencia condicionada Propagación de la evidencia en RBG Normalidad y No Normalidad Test de Doornick-Hansen Distribución Nonparanormal Modelos de transporte Introducción Fundamentos previos ¿Qué son y para qué se usan? Objetivos principales Tipología y niveles de detalle Modelo clásico de cuatro etapas Introducción Especificaciones del Modelo clásico de cuatro etapas Etapa 1: Generación-Atracción de viajes. Etapa 2: Distribución de viajes Etapa 3: Reparto o elección modal Etapa 4: Asignación a la red Métodos de asignación Consideraciones de los modelos de elección modal Multinomial Logit (MNL) Redes Neuronales (RN) Caso de estudio: Corredor Ferroviario Bioceánico Central Introducción Objetivos Objetivos generales Objetivos específicos Marco de actuación Metodología Base de datos Alternativas de elección Ficheros principales de datos y estructura Archivo Excel Dataset Eleccion Modal Hoja Excel DATASET Elección Modal Archivo Excel RDataset Fichero de texto elecmod Propósitos del modelo de elección modal Calibración del MNL Calibración de la RN Calibración de la RB Ajuste en RStudio de RN y RB Ajuste de redes neuronales Ajuste de redes bayesianas Resultados Conclusiones Futuras líneas de investigación Bibliografía Muestra de la Base de Datos DATASET ELECCION MODAL RDATASET: DATASET RDATASET: DATANORM MACRO: R_Red Neuronal.R MACRO: Trainnet.R MACRO: R_Red Bayesiana.R 0: 0: 1: 2: 3: 4: 5: 6: 7: 8: 9: 10: 11: 12: 13: 14: 15: 16: 17: 18: 19: 20: 21: 22: 23: 24: 25: 26: 27: 28: 29: 30: 31: 32: 33: 34: 35: 36: 37: 38: 39: 40: 41: 42: 43: 44: 45: 46: 47: 48: 49: 50: 51: 52: 53: 54: 55: 56: 57: 58: 59: 60: 61: 62: 63: 64: 65: 66: 67: 68: 69: 70: 71: 72: 73: 74: 75: 76: 77: 78: 79: 80: 81: 82: 83: 84: 85: 86: 87: 88: 89: 90: 91: 92: 93: 94: 95: 96: 97: 98: 99: 100: 101: 102: 103: 104: 105: 106: 107: 108: 109: 110: 111: 112: 113: 114: 115: 116: 117: anm0: