Please use this identifier to cite or link to this item:
http://hdl.handle.net/1942/25272
Title: | Agent-based models for Infectious Disease Transmission: Exploration, Estimation & Computational Efficiency | Authors: | WILLEM, Lander | Advisors: | HENS, Niel Beutels, Philippe Broeckhove, Jan |
Issue Date: | 2015 | Abstract: | Infectious diseases like influenza cause significant morbidity and mortality
during annual epidemics and occasional pandemics. Mathematical models are
widely used as pragmatic tools to inform policy on health care interventions
when pre-introduction clinical trials are unfeasible for budget or ethical reasons.
The spread of infectious diseases in human populations is usually simulated
with deterministic compartmental models that partition the population according to health state. Household compositions, locality and social mobility
are typically ignored. Agent-based models (ABMs) track each individual in
the population separately and allow for random events and heterogeneous
behavior, which are large improvements compared to deterministic compartment models. The aim of this PhD was to explore and improve agent-based
transmission models for infectious diseases and elaborates on five key aspects:
model exploration, parameter estimation, social contact patterns, computational efficiency and synthetic populations.
Model exploration needs to be systematic to gain a thorough system understanding. We investigated the usefulness of model-guided experimentation,
called active learning, based on machine learning techniques such as iterative
surrogate modeling to systematically analyze both common and edge manifestations of complex model runs. Model exploration is required to focus
research by reducing dimensionality and decision uncertainty. We illustrate the
methodology for agent-based and compartmental modeling and demonstrate
that active learning is needed to fully understand complex system behavior.
Surrogate models can be readily explored at no computational expense and be
used as emulator to improve rapid policy making in various settings.
Parameter estimations profoundly affect model results. In previous seasonal
influenza models, these parameter values were commonly chosen ad hoc, ignoring between-season variability and without formal model validation or
sensitivity analyses. We propose to directly estimate the parameters by fitting
the model to age-specific influenza-like illness incidence data over multiple
influenza seasons. The results demonstrate the importance of between-season
variability in influenza transmission and the transmission estimates are in line
with the classification of influenza seasons according to intensity and vaccine
matching. crete-time ABM for
close-contact disease transmission. Key steps are straightforward: improve
data locality and reduce the number of operation with prior sorting. We recommend that future studies evaluate the impact of data management, algorithmic
procedures and parallelization on model performance.
Synthetic populations inside ABMs should be able to adequately represent
the individual characteristics of interest. The structure of social contact clusters,
especially households, and their interactions are essential to simulate epidemic
outbreaks. Many techniques to generate synthetic populations have been described but some issues remain. Most methods make use of disaggregated
survey data (=seed set) in combination with census data to sample new populations. We elaborated on methods to adjust household survey data into a
representative seed set: extrapolation over time, age-correction in single-person
households and household-weights based on size. In-dept comparison with
existing methods has to be performed, though we believe this approach is a
valuable contribution to the synthetic reconstruction methods.
In conclusion, agent-based models offer endless possibilities but systematic
model exploration is needed to focus research and optimize parameter estimations through fitting to data. The incorporation of realistic social contact
behavior based on synthetic population structures is essential to obtain trust-worthy results. Improving model performance facilitates model opportunities
to evaluate control strategies for emerging infectious diseases and protect
public health. Infectieziektes zoals de griep veroorzaken jaarlijks een aanzienlijke ziektelast en sterfte onder de oudere bevolking en bij kinderen. Daarnaast vormen deze ook een bedreiging op wereldvlak door occasionele pandemieen zoals de Mexi- ¨ caanse griep in 2009. Om het beleid inzake gezondheidszorg te informeren worden wiskundige modellen ingezet als pragmatisch hulpmiddel wanneer grootschalige studies onmogelijk zijn omwille van ethische of budgettaire redenen. Tot nu toe werden voornamelijk deterministische compartiment-modellen gebruikt om de verspreiding van infectieziektes te simuleren. Deze modellen focussen op de globale gezondheidstoestand van de populatie en negeren doorgaans individuele heterogeniteit en stochastische effecten die nochtans van groot belang zijn tijdens de initiele of finale fase van een epidemie. Individu- ¨ gebaseerde of agent-gebaseerde modellen (ABM) bieden wel de mogelijkheid om unieke gedragingen van een individu en toeval in rekening te brengen. Het doel van dit doctoraatsonderzoek is het gebruik van een ABM voor de verspreiding van infectieziektes te verbeteren door in te gaan op vijf belangrijke aspecten: model exploratie, parameterschatting, sociale contactpatronen, computationele efficientie en synthetische populaties. ¨ Model exploratie moet systematisch gebeuren om grondig inzicht te verwerven in de normale en uitzonderlijke gedragingen van een simulatiemodel. We onderzochten het nut van een model-gestuurde onderzoeksmethode, genaamd “actief leren”: een iteratief proces gebaseerd op bestaande machine learning technieken zoals surrogaat-modelleren. Model exploratie is vereist om onderzoek bij te sturen en de dimensionaliteit en structurele onzekerheid te reduceren. Toepassingen met een ABM en een compartiment-model hebben aangetoond dat actief leren nodig is om complexe systemen beter te begrijpen. Surrogaat modellen, die de resultaten van complexe simulaties benaderen, kunnen eenvoudig gebruikt worden als emulator om snel en efficient beleids- ¨ vorming te informeren in verschillende contexten. Parameterschatting speelt een grote rol in de betrouwbaarheid van een simulatiestudie. In voorgaand onderzoek betreffende seizoensgriep werden input parameters vaak ad hoc gekozen zonder onderscheid te maken tussen seizoenen en zonder formele validatie of sensitiviteitsanalyse. Wij hebben aangetoond dat het ook mogelijk is om parameters te schatten met het transmissie-model door de output te vergelijken met referentiedata. Voor een studie rond seizoensgriep hebben we hiervoor gebruik gemaakt van de leeftijdsspecifieke incidentie van griepachtige symptomen over meerdere griepseizoenen. De resultaten van ons model hebben aangetoond dat seizoen-specifieke parameters belangrijk zijn om de transmissie van griep te simuleren en te voorspellen in de toekomst. De parameterschattingen met ons model inzake transmissie worden bevestigd door de algemene indeling van griepseizoenen volgens intensiteit en vaccinmatching. Sociale contactpatronen vormen de motor voor de verspreiding van infectieziektes. Ondanks de jaarlijks terugkerende griepepidemie, blijven contextuele omstandigheden die deze seizoensgebonden transmissie be¨ınvloeden onduidelijk. De hypothese is dat biologische en fysische effecten interageren met schommelingen in sociale contactpatronen en de overdracht van ziektes bevorderen tijdens de winter. In dit kader hebben wij sociale contactgegevens geanalyseerd en observeerden we naast het effect van week/weekend en reguliere/vakantie periode een toename van langdurige contacten (>1uur) tijdens reguliere werkdagen met lage temperaturen, bijna geen neerslag en een lage absolute luchtvochtigheid. Deze weercondities werden in voorgaand onderzoek gelinkt aan een verhoogde kans op virus overleving en overdracht. De combinatie van weersomstandigheden en sociale contactpatronen biedt mogelijkheden voor toekomstige transmissiemodellen. Computationele effici¨entie is relevant voor een breed gamma van wiskundige modellen. Vooruitgang in computertechnologie stimuleert het gebruik van complexe en veeleisende ABM toepassingen, maar de toenemende hardware complexiteit vereist aangepaste software om het volledige potentieel van de huidige rekenkracht te benutten. We hebben grote efficientiewinsten geboekt ¨ met de optimalisatie van ABM code in C++ voor een besmettelijke ziekte zoals griep. Kort samengevat: gegevens die vaak gecombineerd worden in het model moeten ook samen opslagen worden in het geheugen en bijkomende sortering kan het aantal intensieve bewerkingen reduceren. Wij raden aan dat toekomstige studies de impact van data management, algoritmische procedures en parallellisatie evalueren om optimaal gebruik te maken van de simulatie modellen. Synthetische populaties moeten in staat zijn om de individuele kenmerken, die van belang zijn voor het onderzoek, na te bootsen. In de context van infectieziektes zijn de clusters waarin sociale contacten plaatsvinden, met name de huishoudens, van groot belang samen met hun onderlinge uitwisseling. De meeste methoden voor synthetische reconstructie maken gebruik van een beperkte set van individuele huishoudgegevens in combinatie met geaggre-geerde gegevens over de volledige populatie. Wij beschrijven een methode om de representativiteit van huishouddata te verhogen zodat deze meer geschikt is als basis voor een synthetische populatie. Hiervoor is nood aan extrapolatie van de data over een periode van 5 jaar, correctie van leeftijden in 1-persoonshuishoudens en sample-gewichten op basis van huishoudgrootte. Een grondige vergelijking van onze resultaten met bestaande methoden dient nog te gebeuren maar we zijn ervan overtuigd een waardevolle bijdrage te hebben geleverd aan het onderzoeksdomein rond synthetische reconstructie. Tot slot, individu-gebaseerde modellen bieden eindeloze mogelijkheden maar systematische model-exploratie is vereist om analyses te focussen en parameterschattingen met behulp van referentiedata te optimaliseren. De integratie van realistische sociale contactpatronen, geent op de synthetische populatie, ¨ is essentieel om betrouwbare resultaten te verkrijgen. Het verbeteren van de computationele efficientie van een model vergroot de mogelijkheden om ¨ strategieen tegen opkomende infectieziekten te evalueren en het beleid voor ¨ de toekomst te informeren. |
Document URI: | http://hdl.handle.net/1942/25272 | Category: | T1 | Type: | Theses and Dissertations |
Appears in Collections: | PhD theses Research publications |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
landerwillem.pdf | 12.27 MB | Adobe PDF | View/Open |
Google ScholarTM
Check
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.