Please use this identifier to cite or link to this item: http://hdl.handle.net/1942/33678
Title: Modelling hierarchically clustered survival data through nested Archimedean copulas
Authors: HASAN, Mirza Nazmul 
Advisors: Braekers, Roel
Verhasselt, Anneleen
Issue Date: 2021
Abstract: Onderzoekers hebben twee primaire interesses bij het modelleren van gecorreleerde of geclusterde overlevingsgegevens: het bepalen van het effect van behandeling/covariaten en het bestuderen van de afhankelijkheden of associatie tussen de verzamelde gegevens. De laatste jaren is er een groeiende belangstelling voor het modelleren van verschillende soorten geclusterde overlevingsgegevens. Het komt echter vaak voor dat deze overlevingsgegevens onvolledig of onjuist zijn. Een van de redenen voor deze onvolledigheid is censurering. Censurering komt vaak voor in medische onderzoeken waarbij een patiënt kan overlijden door een andere oorzaak of de patiënt kan besluiten het onderzoek te verlaten. Voor deze waarnemingen is de ware tijd tot de gebeurtenis onbekend en is alleen een ondergrens voor de overlevingstijd bekend, en daarom worden dergelijke gegevens rechts gecensureerd genoemd. Verder kan een onderzoek gegroepeerde of geclusterde overlevingsgegevens omvatten en kan de clustering op meer dan één niveau plaatsvinden. Zo zijn in een sterftestudie onder kankerpatiënten de patiënten geclusterd in ziekenhuizen, die op hun beurt geclusterd zijn binnen districten/provincies. Hierbij wordt aangenomen dat patiënten binnen hetzelfde ziekenhuis/hetzelfde district/dezelfde provincie gecorreleerd zijn, aangezien ze een aantal gemeenschappelijke zorgpraktijken delen. Twee benaderingen worden vaak gebruikt om dergelijke geclusterde overlevingsgegevens te analyseren wanneer we de associatie tussen de overlevingstijden binnen een cluster en/of subcluster willen schatten: frailty- modellen en copula-modellen. Beide modellen hebben hun voordelen en beperkingen. De grootste beperking bij het fraity-model is dat de functies die de marginale overleving beschrijven ook afhankelijk zijn van de associatieparameter uit de gezamenlijke overlevingsfunctie. Dit is niet het geval bij het copula-model en de marginale overlevingsfuncties zijn onafhankelijk van de associatiestructuur. Het copulamodel is minder geschikt wanneer de clusters en/of subclusters groot zijn of verschillen in grootte. In het eerste deel van dit proefschrift hebben we een belangrijke klasse van copula’s besproken, namelijk Archimedische copula’s. Deze copula’s hebben veel leuke eigenschappen: ze zijn gemakkelijk te construeren en er is een grote flexibiliteit in het modelleren van verschillende soorten afhankelijkheden met deze klasse. We hebben de problemen van de ongebalanceerde grootte van de clusters en/of de subclusters aangepakt door de eigenschappen van deze klasse copula’s te gebruiken. In Hoofdstuk 2 hebben we een algemene waarschijnlijkheidsfunctie afgeleid voor hiërarchisch geclusterde overlevingsgegevens door gedeeltelijk geneste Archimedische copula-functies te gebruiken. Bovendien hebben we de log-waarschijnlijkheidsfunctie verkregen voor twee specifieke families van geneste Archimedische copula’s, namelijk geneste Clayton en geneste Gumbel-copula’s. We onderzochten een één-staps, twee-staps en drie-staps parametrische schattingsmethoden om de parameters van het voorgestelde geneste Archimedische copula-model te schatten. Simulatiestudies zijn uitgevoerd om de prestaties van het door ons ontwikkelde model te controleren. Alle drie de schattingsmethoden leverden ongeveer zuivere en consistente parameterschattingen op. De één-staps schattingsmethode presteerde beter in vergelijking met andere twee schattingsmethoden. In Hoofdstuk 3 hebben we verschillende geneste Archimedische copula-modellen voor hiërarchisch geclusterde overlevingsgegevens vergeleken met elkaar op basis van verschillende correlatiestructuren. Hierbij zijn de modellen opgesteld voor (mengsels van) de Claytoncopula en (mengsels van) de Gumbel-copula. Het juiste model wordt gekozen door de verschillende geneste modellen te vergelijken door middel van likelihood ratio tests. Simulatiestudies zijn uitgevoerd om de verdeling, het significantieniveau en de power van de likelihood ratio-tests te controleren. De empirische verdeling van de waarschijnlijkheidsratio kwam in de meeste gevallen echter niet overeen met de momenteel beschikbare literatuur voor de algemene ongecensureerde gegevens. Bovendien zijn eerdere studies over LR-tests voor gecensureerde gegevens, geanalyseerd door geneste Archimedische copula-functies, zeer zeldzaam. Dit is iets voor het toekomstige onderzoek. In het tweede deel (Hoofdstuk 4) van dit proefschrift hebben we een copula-model ontwikkeld voor de associatie in bivariate overlevingsgegevens door gebruik te maken van Bernstein-polynomen. Hiermee benaderen we de copula-functie en de copula-dichtheid voor bivariate overlevingsgegevens. We onderzochten een twee-staps parametrische schattingsmethode waarin we de parameters van de marginale modellen in de eerste fase en de Bernstein-coëfficiënten van de associatie in de tweede fase schatten. We hebben de Bernstein-coëfficiënten geschat met behulp van een gepenalizeerde log-waarschijnlijkheidsmethode. Hierbij hebben we de penaltyparameter en verschillende randvoorwaarden gebruikt om te zorgen voor uniforme univariate marges, zodat de gepaste dichtheid zelf een copula-dichtheid is. Simulatiestudies bevestigden het voordeel van de penalizatie. Verder hebben we de gecorrigeerde AIC gebruikt om het beste model te kiezen, waarbij we verschillende waarden van de penaltyparameter, verschillende penalisatiebenaderingen en basisdimensies vergeleken. De Bernstein-copula benaderde het beste voor de Frankcopula, gevolgd door de Gaussian-copula. Vanwege de staartafhankelijkheid in de Claytonen Gumbel-copula’s is de Bernstein-copulabenadering minder geschikt. Het werkte echter beter voor kleine tot matige associaties.
Document URI: http://hdl.handle.net/1942/33678
Category: T1
Type: Theses and Dissertations
Appears in Collections:Research publications

Files in This Item:
File Description SizeFormat 
PhD thesis_Mirza_2021.pdf
  Until 2026-02-11
12.42 MBAdobe PDFView/Open    Request a copy
Show full item record

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.