Bayesian Approaches for Origin-Destination Modeling and Traffic Assignment Inference

PERRAKIS, Konstantinos

Please use this identifier to cite or link to this item: http://hdl.handle.net/1942/20499

Title:	Bayesian Approaches for Origin-Destination Modeling and Traffic Assignment Inference
Authors:	PERRAKIS, Konstantinos
Advisors:	JANSSENS, Davy KARLIS, Dimitris
Issue Date:	2012
Abstract:	This dissertation is related to the topic of origin-destination (OD) analysis and to relative aspects surrounding this topic within the domain of transportation. In essence, an OD matrix summarizes the travel-demand of a given geographical area and is the basic input to the last modeling phase of any sequential traveldemand forecasting model which involves a traffic assignment procedure. The core of this dissertation is a new methodological approach to OD modeling. The approach is statistical, based on Bayesian Poisson mixture modeling, and can be viewed as a modern direct-demand/gravity modeling framework which incorporates the first two phases of a four-step model. Bayesian methods provide an appropriate working framework for quantifying uncertainties related to parameters as well as predictions of short-term traffic. The proposed methodology is implemented on OD data derived from the 2001 Belgian census study. The study focuses on OD movements between the 308 municipalities of Flanders. A set of 25 explanatory is used to model expected OD trips under the assumption of a log-link function. Initially, a comparison is carried out between a Poisson model and a negative binomial model which indicates that the latter is noticeably a more suitable model due to extreme over-dispersion. Emphasis is placed on the hierarchical negative binomial structure, which is a Poisson-gamma (PG) model with random effects accounting for heterogeneity. The PG model is further compared with a Poissonlognormal (PLN) and a Poisson-inverse Gaussian (PIG) model. In this first full Bayesian PIG application it is shown that the model has desired distributional properties. In addition, the PIG model provides the best marginal fit. Concerning parameter significance and interpretation, all explanatory variables have statistically significant effects which have consistent interpretations with respect to transportation modeling expectations. Moreover, the proximity of PG and PIG predictions to the observed data is evaluated according to several measures of discrepancy. The overall fit is found in general to be satisfactory. One important finding is that both models tend to underestimate the number of zero-valued OD pairs. Although replicating the number of zero-valued cells is not one of the primary goals of the analysis, it is shown that zero-valued cells can have a strong cumulative influence on total travel-demand. In general, one of the advantages of using Bayesian methods is that one can predict the short-term distribution of any type and/or combination of trips that are of interest. This provides predictive distributions which are particularly useful in transport planning and policy evaluation. Subsequent research focuses on traffic-assignment and network-congestion inference. The methodology is based on utilizing the predictive output of the models as input to traffic assignment. Specifically, two methods of inputting OD predictions are discussed. In the first method an OD summary is calculated first and then assigned to the network, whereas in the second method all OD predictions are assigned to the network individually. Method 1 leads to approximate-network inference and is computationally less demanding, but not as exact as method 2. In general, method 2 is promoted and advocated as it provides a suitable tool for full-network inference regarding point and interval estimates, link flow distributions and identification of congested links by means of probability estimates. The methods are compared on the Flemish road network for traffic concerning going-to-work/school trips by Flemish residents between the peak hour from 7 am to 8 am. Initial results, based on deterministic user equilibrium (DUE) assignment, indicate that traffic flows in Flanders are denser around the major municipal centers of Antwerp, Ghent, Leuven and Bruges, and on the highways which connect these cities with each other and also with Brussels. In addition, eleven congested links are identified through method 2 as having a non-zero probability of exceeding a volume-over-capacity (V/C) threshold value of 0.95, the majority of which belonging to Antwerp and Ghent. Contrary, when using the expected V/C ratio as an identification criterion, four of these links are not identified. In general, the comparison between the two inputting methods provides some initial evidence that method 1 might be suitable when the sole goal is to have a point estimate of the expected state of the network. Specifically, in relation to the behavior of total system travel time (TSTT) and Jensen’s inequality, the estimate from method 1 is found to be indeed smaller than the estimate from method 2 in accordance to theory. Nonetheless, in practical terms the two estimates are relatively close. Regarding percentile estimates, estimates from method 1 result in interval estimates which are evidently narrower and thus fail to capture the complete variability which is induced by travel-demand uncertainty. Additional comparisons between PG and PIG predictions reveal that the choice of the statistical model also has a certain influence concerning inference for aggregated link flow distributions. Nevertheless, main inferences concerning the behavior of TSTT and V/C ratios are not affected. Further traffic assignment experiments are implemented next by comparing results between DUE assignment and stochastic user equilibrium (SUE) assignment under both probit and logit route-choice models and for different values of perception-error variance. These comparisons are conditional on PG predictions. Results concerning TSTT are again in agreement with the theory related to Jensen’s inequality. Results for aggregated link volumes are less straightforward to interpret, nevertheless, some general conclusions are in accordance with theoretical expectations. First, DUE assignment allocates more traffic to high-capacity links, while SUE assignment allocates more traffic to medium-capacity links. Second, when considering the total amount of traffic, SUE assignment produces more traffic than DUE and in addition traffic under SUE increases as error-perception variance increases. Regarding congestion analysis, results reveal that the selection of assignment model does not seriously affect the general allocation of links in relation to expected V/C ratios. On the other hand, variability is present when examining individual V/C distributions. In addition, under SUE assignment bimodal as well as multimodal V/C distributions arise. These results grant additional support to the use of probability estimates as opposed to centrality estimates as indicators of congestion. Finally, the recently developed radiation model is discussed in certain detail due to its strong relevance with this current research. Initial attempts of assimilating the radiation model within the modeling framework, considered here, are illustrated. Initially, the variable of circular area population – introduced in the radiation model – is used as an explanatory variable with negative binomial likelihood assumptions. In addition, a first possible Bayesian extension of the radiation model is discussed. Dit proefschrift gaat over de schatting van herkomst-bestemmingsmatrices (origin-destination (OD) matrices) en de hieraan gerelateerde aspecten in het domein van vervoer. In essentie bevat een OD-matrix een overzicht van de vervoersvraag van een bepaald geografisch gebied en behoort het tot de basisinput voor de laatste modelleringsfase van elke sequentieel vervoersvraagprognosemodel dat gebruik maakt van verkeerstoedeling. De kern van dit proefschrift is een nieuwe methodologische benadering voor het schatten van OD-matrices. Het is een statistische aanpak, gebaseerd op het Bayesiaanse Poisson mixed model, dat beschouwd kan worden als een modern directe vraagmodel dat de eerste twee fasen van een vier-stapsmodel bevat. Bayesiaanse methoden bieden een passend kader voor het kwantificeren van onzekerheden met betrekking tot parameters alsook voor korte-termijn verkeersvoorspellingen. De voorgestelde methodologie werd toegepast op OD-gegevens, afkomstig van de Belgische census gehouden in 2001. In dit doctoraat is de analyse gericht op OD-relaties tussen de 308 Vlaamse gemeenten. Er wordt een set van 25 verklarende variabelen gebruikt om verwachte OD-trips te modelleren, onder de veronderstelling van een log-linkfunctie. Eerst wordt een Poisson model vergeleken met een negatief binomiaal model. Hieruit blijkt duidelijk dat het laatste model geschikter is omwille van extreme overdispersie. De nadruk wordt gelegd op de hiërarchisch negatieve binomiale structuur. Dit is een Poissongamma (PG) model met random effecten die heterogeniteit vertegenwoordigen. Het PG-model wordt verder vergeleken met een Poisson-logaritmisch (PLN) en een Poisson-Invers Gaussiaans (PIG) model. In deze eerste volledige toepassing van het Bayesiaanse PIG model wordt aangetoond dat dit model gewenste distributie-eigenschappen heeft. Bovendien biedt het PIG-model de beste marginale fit. Wat het belang en de interpretatie van de parameters betreft, hebben alle verklarende variabelen statistisch significante effecten waarvan de interpretatie overeenkomt met de verwachte vervoersmodelleringen. Bovendien wordt de benadering van PG- en PIG-voorspellingen op de waargenomen gegevens geëvalueerd volgens verschillende afwijkingsgradaties. De algemene fit is meestal bevredigend. Een belangrijke vaststelling is dat beide modellen de neiging hebben om het aantal OD-paren met nulwaarden te onderschatten. Hoewel het niet de belangrijkste doelstelling van de analyse is om het aantal cellen met nulwaarde te herhalen, werd aangetoond dat cellen met een nulwaarde een sterk cumulatieve invloed kunnen hebben op de totale vervoersvraag. Over het algemeen is één van de voordelen van de Bayesiaanse methoden dat men het korte-termijn type en/of de combinatie van trips waarin men geïnteresseerd is kan voorspellen. Dit levert voorspellingen op met betrekking tot distributies die vooral handig zijn bij vervoersplanning en beleidsevaluatie. Verder onderzoek is gericht op verkeerstoedeling en de deductie van netwerkcongestie. In deze methode wordt de voorspellingen van de bovenvermelde modellen gebruikt als input voor de verkeerstoedeling. Meer specifiek worden er twee methoden besproken, die gebruik maken van de ODvoorspellingen. In de eerste methode wordt er eerst een samenvattende ODmatrix berekend en vervolgens wordt dit toegewezen aan het netwerk. In de tweede methode daarentegen, worden alle OD-voorspellingen afzonderlijk aan het netwerk toegewezen. Methode 1 leidt tot een deductie van het geschatte netwerk en is makkelijker te berekenen, maar is niet zo accuraat als methode 2. Over het algemeen wordt methode 2 aanbevolen aangezien het geschikt is voor de deductie van een volledig netwerk met betrekking tot punt- en intervalschattingen, linkflowdistributies en de identificatie van overbelaste links door middel van waarschijnlijkheidsschattingen. De methoden worden vergeleken op het Vlaamse wegennet voor het woonwerkverkeer en woon-schoolverkeer, gedaan door Vlamingen tussen het piekuur van 7u tot 8u. Uit de eerste resultaten, bekomen door een deterministische gebruikersevenwichttoewijzing (DUE), blijkt dat er in Vlaanderen grotere verkeersstromen zijn rond de belangrijkste stedelijke centra Antwerpen, Gent, Leuven en Brugge, en op de snelwegen die deze steden met elkaar en met Brussel verbinden. Bovendien worden er door middel van methode 2 elf overbelaste links geïdentificeerd. Deze links hebben een kans groter dan nul om de drempelwaarde van 0,95 van volume over capaciteit (V/C) te overschrijden. De meerderheid hiervan behoort tot Antwerpen en Gent. Wanneer men daarentegen de verwachte V/C-verhouding gebruikt als een identificatiecriterium worden vier van deze links niet geïdentificeerd. Over het algemeen wijst een vergelijking tussen de twee inputmethoden een eerste bewijs dat methode 1 geschikt zou kunnen zijn wanneer de enige doelstelling erin bestaat om een puntschatting te verkrijgen van de verwachte staat van het netwerk. In het bijzonder met betrekking tot het gedrag van de totale reistijd (TSTT) en Jensens ongelijkheid, blijkt de schatting van methode 1 inderdaad kleiner te zijn dan de schatting van methode 2, wat in overeenstemming is met de theorie. In de praktijk liggen de twee schattingen echter relatief dicht bij elkaar. Met betrekking tot percentuele schattingen, leveren de schattingen van methode 1 intervalschattingen op die blijkbaar kleiner zijn en daarom niet de volledige breedte aan variatie bevatten die eigen is aan de vervoersvraagonzekerheid. Bijkomende vergelijkingen tussen PG- en PIG-predicties tonen aan dat de keuze van het statistische model ook een zekere invloed heeft op de deductie van geaggregeerde linkflowdistributies. Niettemin worden de belangrijkste deducties met betrekking tot het gedrag van TSTT en V/C-ratio niet beïnvloed. Vervolgens worden bijkomende verkeerstoedelingsexperimenten uitgevoerd door de resultaten van de DUE-toedeling en de stochastische gebruikersequilibrium (SUE)-toedeling te vergelijken onder zowel probit als logit routekeuzemodellen en voor verschillende waarden van variatie in perceptiefouten. Deze resultaten zijn gebaseerd op de PG-voorspellingen. De TSTT-resultaten komen opnieuw overeen met Jensens theorie van ongelijkheid. De resultaten voor geaggregeerde linkvolumes zijn minder gemakkelijk te interpreteren. Niettemin stemmen enkele algemene conclusies overeen met de theoretische verwachtingen. Ten eerste wordt bij DUE-toewijzing meer verkeer toegewezen naar links met een hoge capaciteit, terwijl bij SUE-toewijzing meer verkeer toegewezen wordt naar links met een gemiddelde capaciteit. Wanneer men ten tweede de totale hoeveelheid verkeer in acht neemt, produceert een SUE-toewijzing meer verkeer dan een DUE-toewijzing en bovendien neemt het volume van verkeer onder SUE-toewijzing toe naarmate de foutperceptievariantie toeneemt. Wat congestieanalyse betreft wijzen resultaten uit dat de keuze van het toewijzingsmodel geen grote impact heeft op de algemene toewijzing van links met betrekking tot verwachte V/C ratio's. Anderzijds is variabiliteit aanwezig bij individuele V/C distributies. Bij SUEtoewijzing ontstaan bovendien zowel bimodale als multimodale V/C distributies. Deze resultaten geven een extra stimulans voor het gebruik van waarschijnlijkheidsschattingen in plaats van gemiddeldeschattingen als congestie-indicator. Tot slot wordt het onlangs ontwikkelde radiatiemodel omwille van het sterke verband met dit doctoraatsonderzoek tot op een bepaald niveau van detail bediscussieerd. Eerste pogingen om het radiatiemodel te assimileren binnen het modelleringskader van dit proefschrift worden geïllustreerd. In eerste instantie wordt de “cirkelvormige zonebevolking”-variabele – geïntroduceerd in het radiatiemodel – gebruikt als een verklarende variabele met negatief binomiale waarschijnlijkheidsveronderstellingen. Bovendien wordt een eerste mogelijke Bayesiaanse uitbreiding van het radiatiemodel besproken.
Document URI:	http://hdl.handle.net/1942/20499
Category:	T1
Type:	Theses and Dissertations
Appears in Collections:	PhD theses Research publications

Files in This Item:

File	Description	Size	Format
3195 D-2012-2451-35 Konstantinos Perrakis.pdf		3.17 MB	Adobe PDF	View/Open

Show full item record

Google Scholar^TM

Check

Files in This Item:

Google ScholarTM

Google Scholar^TM