Please use this identifier to cite or link to this item: http://hdl.handle.net/1942/32419
Title: Statistical perspectives on the analysis of disease outbreak data using mechanistic and phenomenological models
Authors: GANYANI, Tapiwa 
Advisors: Faes, Christel
Hens, Niel
Issue Date: 2020
Abstract: In de vroege stadia van uitbraken van infectieziekten is het belangrijk om met behulp van beschikbare gegevens over de uitbraak de belangrijkste kenmerken van de ziekte te kwantificeren, zoals bijvoorbeeld de basis- en effectieve reproductieaantallen, de generatietijd, het aandeel van transmissies v´o´or symptomen, en de uiteindelijke grootte van de uitbraak. Kennis van dergelijke kenmerken helpt bij het evalueren van het dreigingsniveau en de tijdlijnen waarbinnen de dreiging zich waarschijnlijk zal ontwikkelen; het kan ook de ontwikkeling van controlestrategie¨en voor de volksgezondheid ondersteunen en de beleidsvorming op de hoogste niveaus informeren (Hollingsworth, 2009). In dit proefschrift hebben we enkele concepten onderzocht die verband houden met de statistische analyse en interpretatie van gegevens over uitbraken van infectieziekten. Vervolgens hebben we nieuwe statistische benaderingen ontwikkeld en voorgesteld om gegevens over de incidentie van infectieziekten te analyseren en de belangrijkste ziektekenmerken in te schatten tijdens de vroege stadia van uitbraken. We starten met eenvoudige en fundamentele mechanistische en fenomenologische modellen. In Hoofdstuk 3 bespeken we verschillende simulatie- en analysebenaderingen voor compartimentele modellen. We beschrijven hoe gegevens over uitbraken van infectieziekten kunnen worden gesimuleerd met behulp van de Gillespie SSA en een van de τ−sprongbenaderingen, evenals met behulp van SDE’s. We hebben deze drie methoden vergeleken met de deterministische oplossing met betrekking tot piektijd, piekincidentie, epidemische duur en uiteindelijke grootte. Gemiddeld lagen de schattingen, zoals verwacht, redelijk dicht bij de werkelijke waarden. De Gillespiebenaderingen leidden echter tot grotere onzekerheid vanwege de probabilistische aard van hoe individuen verondersteld worden zich van het ene compartiment naar het andere te verplaatsen; als zodanig verdienen deze methoden de voorkeur. In ter men van analyse beschrijven we verschillende bronnen van stochasticiteit, namelijk metings-, demografisch- en omgevings-ruis. Zoals in het POMP-raamwerk (King et al., 2016) maken we gebruik van deterministische en stochastische modellen en toonden we aan hoe deze modellen kunnen worden gerelateerd aan waargenomen incidentiegegevens met behulp van een measurement model en hoe ze kunnen gefit worden met behulp van een sequenti”ele Monte Carlo-benadering. Zoals opgemerkt in b.v. Bartlett (1956) geven onze resultaten aan dat stochastische modellen de voorkeur verdienen, aangezien ze een meer realistische en geschikte manier bieden om rekening te houden met variabiliteit in de gegevens en om de onzekerheid van parameterschattingen nauwkeurig te kwantificeren. Voor infectieziekten zoals bijvoorbeeld mazelen, hiv/aids en mond- en klauwzeer (Viboud et al., 2016) is er een langzamere dan exponenti¨le groeidynamiek. Met behulp van simulaties en echte epidemische gegevens hebben we in Hoofdstuk 4 de schatting van het basisreproductiegetal bestudeerd met behulp van een flexibel stochastisch SIR-model dat een groeischaalparameter bevat die een langzamere dan exponenti¨le groeidynamiek mogelijk maakt, dwz afwijking van de exponenti¨ele groei-aanname ge¨ımpliceerd door het klassieke massa-actieprincipe. Onze resultaten suggereren de noodzaak om het concept van groeischaling in overweging te nemen om nauwkeurigere schattingen van het basisreproductiegetal te genereren. In Hoofdstuk 5 hebben we met behulp van de GGM onderzocht hoe stochasticiteit die inherent is aan gegevens over uitbraken van infectieziekten de schatting van de groeischaling kan be¨ınvloeden en daarom van invloed kan zijn op het vermogen om een zich ontwikkelende uitbraak correct te identificeren als exponentieel of langzamer dan exponentieel stijgend tijdens de vroege fase van een uitbraak. We evalueren de impact van verschillende niveaus van overdispersie op de gevolgtrekking van de groeischaal door Poisson- en negatieve binominale modellen te vergelijken. Simulatieresultaten tonen aan dat het vermogen om groeipatronen bij vroege uitbraken correct te identificeren, kan worden be¨ınvloed door overdispersie, zelfs wanneer dit in rekening werd gebracht met behulp van het negatieve binominale model. Al met al laten onze resultaten zien dat schattingen met de nodige voorzichtigheid moeten worden ge¨ınterpreteerd wanneer de gegevens overdispersed zijn. In hoofdstuk 6 onderzochten we met behulp van het GGM of er een statistisch verband bestaat tussen de waargenomen epidemische grootte en de schaalparameter van epidemische groei van grote ebola-uitbraken op subnationaal niveau van de drie meest getroffen landen tijdens de ebola-epidemie van 2014–16 in West-Afrika. Hiervoor kwantificeren we groeischaal-parameters vanaf de oplopende fase van ebola-uitbraken die ten minste 7 weken epidemische groei omvatten. We bestuderen dan hoe deze parameters zijn geassocieerd met de waargenomen epidemische omvang. Voor validatiedoeleinden analyseren we ook twee historische ebola-uitbraken. We vinden een hoge monotone associatie tussen de schaalparameter en de waargenomen epidemische omvang. Kenmerkende eigenschappen van epidemische groei kunnen nuttig worden om het risico van een grote epidemie te beoordelen, betere ziekteprognoses te genereren en de voorspellende kracht van epidemie¨n te vergroten. Onze resultaten geven aan dat de schaalparameter voor epidemische groei een nuttige indicator is van epidemische omvang, wat aanzienlijke implicaties kan hebben voor de beheersing van ebola-uitbraken en mogelijk andere infectieziekten. Ten slotte ontwikkelen we in Hoofdstuk 7 een methode voor het schatten van de verdeling van het generatie-interval op basis van gegevens over de start van symptomen. De methode bouwt voort op het werk van te Beest et al. (2013), die met behulp van Bayesiaanse methoden de seri¨ele intervalverdeling schatte waardoor aanvullende informatie kon worden gebruikt bij het toewijzen van potenti¨ele infector-ge¨ınfecteerde paren. Onze aanpak houdt rekening met de onzekerheid die gepaard gaat met nietgeobserveerde incubatietijden van potenti¨ele infector-besmette paren. Als resultaat wordt een juiste variantie-schatting voor het generatie-interval afgeleid in tegenstelling tot een te grote variantie-schatting die wordt verkregen wanneer de incubatieperiode wordt genegeerd. Bijgevolg corrigeert de methode voor de onderschatting van het reproductiegetal die optreedt bij het gebruik van het seri¨le interval als proxy voor het generatie-interval (Britton and Scalia-Tomba, 2019; Wallinga and Lipsitch, 2007).
Document URI: http://hdl.handle.net/1942/32419
Category: T1
Type: Theses and Dissertations
Appears in Collections:Research publications

Files in This Item:
File Description SizeFormat 
TapiwaGanyaniPhdThesis.pdf
  Until 2025-10-06
9.53 MBAdobe PDFView/Open    Request a copy
Show full item record

Page view(s)

52
checked on Sep 7, 2022

Download(s)

16
checked on Sep 7, 2022

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.