Please use this identifier to cite or link to this item:
http://hdl.handle.net/1942/16719
Title: | Joint Models for Survival and Longitudinal Data, Missing Data, and Sensitivity Analysis, with Applications in Medical Research | Authors: | NJAGI, Edmund | Advisors: | MOLENBERGHS, Geert VERBEKE, Geert AERTS, Marc |
Issue Date: | 2013 | Abstract: | Het is gebruikelijk van verscheidene types respons tegelijk op te meten, eventueel herhaald in de tijd. In kankerstudies worden verscheidene biologische merkers opgetekend, herhaald in de tijd, met daarnaast ook overlevingstijd of tijd tot metastase. Een typisch voorbeeld is prostaatkanker waar, na behandeling, prostaat-specifieke antigenen wordne gemeten, samen met de tijd tot herval (Law et al., 2002; Yu et al., 2004, 2008). In HIV/AIDS studies meet men, naast tijd tot onset van AIDS of overlijden, de virusdruk en T4 celaantallen. Dendale et al. (2011) en Njagi et al. (2013a,b) beschrijven een cardiologische studie, waarin onderzoekers gebruik maken van telemonitoring (een techniek waarmee pati¨enten vanop afstand worden gevolgd), niet alleen om bloeddruk op dagelijkse basis te meten, ook hartslag en gewicht worden opgetekend, naast tijd tot heropname. Het gaat hierbij om pati¨enten met chronische hartaandoeningen. Andersen et al. (1993) beschrijven een studie in levercirrhose, waar naast overlevingstijd verscheidene biochemische waarden werden opgetekend, zoals bilirubine, albumine, en prothrombine. Daarnaast kan de overlevingstijd zelf herhaald gemeten worden. Dit kan bijvoorbeeld het geval zijn omdat het event ter studie verscheidene keren kan optreden, of omdat de tijd gemeten wordt aan alle leden van een familie of cluster. Bijvoorbeeld, de tijd tot heropname in Dendale et al. (2011) en Njagi et al. (2013a,b) was van het zogenaamde recurrente type, omdat een ontslagen pati¨ent natuurlijk meer dan ´e´en keer kan heropgenomen worden. Duchateau and Janssen (2008) beschrijven een veterinaire studie waar prote¨ıne en ureum concentraties herhaald worden gemeten bij melkkoeien; daarnaast werk ook de tijd tot de eerste inseminatie opgetekend. Omdat koeien clustering vertonen binnen veestapel, is de overlevingstijd hier van het herhaalde type. In dergelijke studies is het niet ongebruikelijk van de verschillende (herhaalde) metingen gelijk te modelleren, in een zogenaamd joint model. Enkele redenen waarom we dit doen zijn als volgt. Ten eerste kan men interesse hebben aan de overlevingstijd, na correctie voor de longitudinale covariaat. Ten tweede kan men, omgekeerd, het longitudinale profiel corrigeren voor eventuele niet-random uitval, veroorzaakt door het event. Ten derde kan er belangstelling zijn voor de associatiestructuur in dit type van gegevens (Tsiatis and Davidian, 2004; Rizopoulos et al., 2009; Verbeke et al., 2010; Rizopoulos, 2012a; Njagi et al., 2013b). Uiteraard is de onderzoeksvraag niet noodzakelijk beperkt tot de respons in hun originnele vorm. Bijvoorbeeld, het kan wetenschappelijk nodig zijn van een continue respons te dichtomiseren alvorens de analyse uit te voeren. Dit betekent dat ongeveer alle combinaties van mogelijke responsen samen kunnen voorkomen. Als een respons van het niet-Gaussische type is, doen er zich problemen voor. Bijvoorbeeld, nog buiten de context van joint modelling, hebben Molenberghs et al. (2007) en Molenberghs et al. (2010) de nadruk gelegd op het modeleren van binomiale gegevens, aantallen, en overlevingstijden. In modellen voor dergelijke gegevens is er een relatie tussen gemiddelde en variantie. Deze relatie wordt niet noodzakelijk gevolgd door de gegevens. De auteurs voerden daarom zogenaamd geconjugeerde random effecten in om deze relatie te versoepelen. We verwijzen naar dit fenomeen als overdispersie. Bij binomiale gegevens en aantallen leidt dat traditioneel tot het betabinomiale en negatief-binomiale model. Als we dit soort gegevens ook hi¨erarchisch verzamelen, worden er normale random effecten toegevoegd om de assocatie tussen de herhaalde metingen te vatten. Dit leidt tot het veralgemeend linear gemengd model (GLMM; generalized linear mixed model). Als beide fenomenen zich tegelijk voordoen, worden ook beide types random effect tegelijk gebruikt. Ze verwijzen naar dit soort modellen als combined model, waar dus op flexibele manier het gemiddelde en de variantie van de metingen, naast de correlatie tussen metingen, word gemodelleerd. Via data analyse werd aangetoond dat dit uitgebreide model het vaak gevoelig beter doet dan standaard modellen. Zelfs wanneer de klemtoon ligt op eenvoudiger modellen, kan het combined model gebruikt worden als goodness-of-fit instrument. De klemtoon in Hoofdstuk 3 ligt op het overbrengen van het combined model naar de context van joint modeling, waarbij minstens ´e´en respons niet-Gaussisch is. Speciale aaandacht gaat uit naar de situatie waarbij ook minstens ´e´en van de responsen een overlevingstijd is. Voor dergelijke gegevens maakt men vaak gebruik van shared-parameter modellen. Een model voor de overlevingstijd wordt dan gelinkt aan het longitudinale proces via een gemeenschappelijk random effect; conditioneel op dit effect wordt verder onafhankelijkheid verondersteld (Tsiatis and Davidian, 2004; Verbeke et al., 2010; Rizopoulos, 2011, 2012a). De latente structuur kan parametrisch zijn, maar dat hoeft niet. Traditioneel werd de overlevingstijd hoogstens ´e´en keer gemeten; vaak werd het longitudinale proces als continu veronderstelt. De random effecten worden traditioneel meestal als normaal verdeeld beschouwd (Verbeke et al., 2010). Overdispersie wordt daarbij niet in rekening gebracht. Al deze beperkingen worden aangepakt in dit hoofdstuk. Verschillende combinaties zijn mogelijk: overlevingstijd en continu; overlevingstijd en binair; overlevingstijd en aantal. Daarnaast wordt ook het samen voorkomen van een continue en een binaire maat beschouwd. Alle respons kan herhaald gemeten zijn. Ook al werd het niet in detail bekeken, het is mogelijk van meer dan twee responsen te bestuderen. In alle gevallen kan men tegelijk normaal verdeelde en geconjugeerde random effecten invoeren. Via data analyse wordt aangetoond dat een dergelijk uitgebreid model tot betere resultaten kan leiden, daarbij inbegrepen impact op significantie. Integratie over het geconjugeerd random effect is eenvoudig; dit wordt aangegrepen om een effici¨ente methode van schatten voor te stellen, gebaseerd op Molenberghs et al. (2007). Het is daarnaast ook mogelijk gesloten vormen af te leiden voor de gemeenschappelijke verdeling. In Hoofdstuk 4 gaan we hierop verder door joint modeling te koppelen aan predictie en onderscheiding van gevallen. We kijken in het bijzonder naar het probleem van dynamische predicties voor heropname bij pati¨enten met chronisch hartfalen (Njagi et al., 2013a). Hartfalen wordt vaak gecompenseerd door mechanismen in het hart die op den duur zelf tot problemen kunnen leiden. Dit noemt decompensatie. Heropname kan oplopen tot 50% per jaar; het is dus een belangrijk probleem dat veel aandacht kreeg in de literatuur (Chin and Goldman, 1997; Lewin et al., 2005; Chaudhry et al., 2007; Zhang et al., 2009; Dendale et al., 2011). We formuleren het kader van Rizopoulos (2012b, 2011) zodanig dat het een oplossing van dit probleem mogelijk maakt. Eerst wordt er een shared random effect model beschouwd voor tijd tot heropname, gecombineerd met longitudinale merkers (Rizopoulos, 2011; Verbeke et al., 2010; Tsiatis and Davidian, 2004). Meetfout in de merkers wordt meeegenomen (Rizopoulos, 2011). Er wordt een dynamische predictie geformuleerd, die dus evolueert naarmate meer gegevens beschikbaar worden. Naast een statistisch correcte oplossing van dit probleem dat belangrijk is maar voordien nog niet werd aangepakt, krijgt de clinicus een belangrijk tool in handen om de beslissingen in de praktijk te ondersteunen (Njagi et al., 2013a). Ontbrekende gegevens is een vaak voorkomend probleem. Men heeft drie grote kaders beschikbaar: selectiemodellen (SeM), pattern-mixture modellen (PMM), en shared-parameter modellen (SPM) (Molenberghs and Kenward, 2007). Men onderscheidt ook dire belangrijke mechanismen (Rubin, 1976; Molenberghs et al., 1998; Creemers et al., 2011): MCAR, MAR, en MNAR. Omdat dergelijke modellen per definitie niet verifieerbare aannames maken, is het nodig van sensitiviteitsanalyses uit te voeren (Verbeke and Molenberghs, 2000; Molenberghs and Verbeke, 2005; Creemers et al., 2010). Door verontderstellingen te vari¨eren krijgt men een idee van de stabiliteit van de conclusies. Er is een verband tussen ontbrekende gegevens in longitudinale studies, en het gemeenschappelijk modelleren van longitudinale gegevens en overlevingstijden. De tweede setting is daarbij ingewikkelder dan de eerste (Njagi et al., 2013c), omdat onvolledigheid op verschieidene manieren kan voorkomen: de overlevingstijd kan gecensureerd zijn, de longitindale sequentie kan onvolledig zijn, of beide kunnen voorkomen. We spreken dan van coarsening in de zin dat de gegevens op een minder fijn niveau worden opgemeten dan men in principe zou willen. Deze correspondentie wordt bestudeerd in Hoofdstuk 5. Hierbij wordt een perspectief op joint modeling gehanteerd, verschillend van wat traditioneel wordt gedaan, en gebaseerd op het uitgebreide SPM van Creemers et al. (2011). Binnen dit kader kunnen we MAR karakteriseren en makkelijk sensitiviteitsanalyse uitvoeren. Coarsening is ´e´en van twee klassen die samen verrijkte gegevens uitmaken. De andere is augmentatie waar aan gegevens structuren worden toegevoegd die niet worden geobserveerd doch het modelleren faciliteren. Voorbeelden zijn random effecten, latente klassen, latente veranderlijken en mengverdelingen. Coarsening verwijst naar onvolledige gegevens en censurering bij overlevingstijden. In alle gevallen is een deel van het model aangestuurd enkel door veronderstellingen en niet door gegevens. De gevaren daarvan dienen ten volle onderkend (Verbeke and Molenberghs, 2010; Molenberghs et al., 2012). Waar dit probleem werd aangepakt in Verbeke and Molenberghs (2010) voor onvolledige gegevens en random effecten, beschouwden Molenberghs et al. (2012) het in een bredere context. Verscheidene settings komen aan bod in Hoofdstuk Chapter 6. Er is meerbepaald aandacht voor latente klassen en latente veranderlijken, factor analyse, eindige mengverdelingen, en frailty modellen. In alle gevallen is er naast goodness-of-fit ook nood aan sensitviteitsanalyse. Data analyse en niet verifieerbare aannames moeten zorgvuldig geschieden worden (Molenberghs et al., 2012). Dit werk sluit af met algemene conclusies en aanbevelingen (Hoofstuk 7). Analyse programma’s en bijkomende resultaten worden ondergebracht in een appendix. | Document URI: | http://hdl.handle.net/1942/16719 | Category: | T1 | Type: | Theses and Dissertations |
Appears in Collections: | PhD theses Research publications |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
NJAGI_EDMUND_NJERU-FinalTHESIS.pdf | 782.79 kB | Adobe PDF | View/Open |
Google ScholarTM
Check
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.