Please use this identifier to cite or link to this item: http://hdl.handle.net/1942/39017
Title: Flexible hazard-based models and quantile regression for right-censored data using two-piece asymmetric distributions
Authors: EWNETU, Worku Biyadgie 
Advisors: Verhasselt, Anneleen
Gijbels, Irène
Issue Date: 2022
Abstract: In many applications of statistical modelling, a vital complexity is that only partial information on the variables of interest is observed. Among such complex data settings are censored data, particularly in time-to-event or survival analysis. In a right-censoring context, it is only known for some studied objects that the survival time of interest exceeds the observed time. This dissertation focuses on statistical inference for a large class of two-piece asymmetric (TPA) distributions in the context of flexible quantile regression and hazard-based models for right-censored survival data. One of the exciting features of these families is that the location parameter coincides with a specific quantile of the distribution. In the particular case of a symmetric distribution, the location parameter coincides with the mean. The first part of the dissertation focuses on statistical inference for the unconditional setting of the TPA family of distributions. We discuss the theoretical development (consistency and asymptotic normality properties) for the maximum likelihood estimators for an entire class of TPA distributions by considering some necessary regularity conditions on the probabilistic distributions involved. We conduct a simulation study to examine the method’s properties in finite–sample cases. We illustrate the applicability of the proposed methods on clinical and non-clinical data examples and compare their performances with some existing survival models. In classical regression analysis, we usually fit the model for the mean of the response variable conditioning on the set of covariates. One may thus estimate the average (mean) of the conditional distribution corresponding to the given set of covariates, and draw only a single regression curve. However, one might be interested in getting the entire picture of the conditional distribution. The second part of the dissertation focuses on the flexible regression setting of TPA families with the aim of conditional quantile curves and survival estimation. Covariates can affect not only the location but also, more generally, the scale and shape of the distribution of the survival time in a multi-parametric regression framework. We exploit the local likelihood estimation technique when covariates come into play in the model through non-parametric (completely unspecified) functional forms. In addition, we propose a general profile (local) likelihood method to estimate the parametric and non-parametric components in the case of a partially linear regression model. We investigate the method’s performance through an extensive simulation study. In addition, the application of the proposed method is discussed with clinical data examples. In time-to-event analysis, many commonly used statistical methods assume that the covariate effects on a monotone transformation of the survival time are linear, and the regression coefficients are constant over time. For instance, the accelerated failure time model estimates the linear covariate effects on the logarithmic scale of the survival time. In contrast, the proportional hazards model assumes linearity on the hazard ratio. These assumptions, however, might be chosen for their mathematical convenience, and the actual associations in practical applications may be more complex than the prespecified linear structure of the covariate effects. The third part of the work deals with a hybrid hazard (HH) model where we consider a parametric TPA baseline hazard distribution with flexible regression settings. We examine the covariate effects at the time-scale and hazard-scale changes in parametric, semi-parametric and non-parametric functional forms. The general hybrid hazard-based model includes the three most commonly used survival models as subclasses: proportional hazards (PH), accelerated failure time (AFT), and accelerated hazards (AH) models. We discuss in detail the estimation procedures in the general profile (local) likelihood technique. We investigate the validity of the flexible HH model formulation and proposed estimation methodology through a comprehensive Monte Carlo simulation study and demonstrate its practical use in real data examples.
In veel toepassingen van statistisch modelleren worden variabelen waarin we ge¨ınteresseerd zijn slechts deels geobserveerd. E´en van dergelijke complexe data situaties zijn gecensureerde gegevens. Deze komen in het bijzonder voor in overlevingsanalyse. In een context van rechtse censurering is voor sommige individuen enkel geweten dat hun overlevingstijd groter is dan de geobserveerde tijd. Deze thesis focust op statistische besluitvorming in een brede familie van twee-stuks asymmetrische (TPA) verdelingen in de context van flexibele kwantielregressie en hazard-gebaseerde modellen voor rechts gecensureerde overlevingsgegevens. Een belangrijke eigenschap van deze familie is dat de locatieparameter overeenkomt met een specifiek kwantiel van de verdeling. In het bijzonder geval van een symmetrische verdeling valt de locatieparameter samen met het gemiddelde. In het eerste deel van de thesis focussen we op statistische besluitvorming voor een niet-voorwaardelijke setting binnen de TPA familie van verdelingen. We onderzoeken de theoretische eigenschappen (consistentie en asymptotische normaliteit) van maximum likelihood schatters voor de hele klasse van TPA verdelingen, onder enkele noodzakelijke regulariteitsvoorwaarden op de verdeling. In een simulatiestudie worden de eindige steekproefkwaliteiten van de methoden onderzocht. Verder illustreren we het gebruik van de voorgestelde methoden op klinische en niet-klinische data en vergelijken we hun prestatie met enkele bestaande overlevingsmodellen. In klassieke regressieanalyse modelleert men het gemiddelde van een respons op basis van een aantal covariaten. Men modelleert dus enkel het gemiddelde van een voorwaardelijke verdeling aan de hand van covariaten. Daarnaast kan men ook ge¨ınteresseerd zijn in de volledige voorwaardelijke verdeling. Het tweede deel behandelt een flexibele regressiesetting met TPA verdelingen met als doel het schatten van de kwantielfunctie en de overlevingskans. In een regressiesetting kunnen covariaten zowel de locatie als de schaal en vorm van de verdeling van de overlevingstijd be¨ınvloeden. We verkennen lokale maximum likelihood schatters wanneer ook covariaten op een niet-parametrische manier in het model worden opgenomen. Bovendien stellen we een algemene profile likelihood methode voor om zowel de parametrische als niet-parametrische componenten te schatten in het geval van een deels lineair regressiemodel. We onderzoeken de werking van de methoden in een uitgebreide simulatiestudie en op enkele klinische data. Vaak gebruikte statistische methoden in overlevingsanalyse veronderstellen dat de covariaten een linear effect hebben op de overlevingstijd via a monotone transformation, en dat de regressieco¨effici¨enten constant zijn in de tijd. In bijvoorbeeld een accelerated failure time model hebben de covariaten een linear effect op het logaritme van de overlevingstijd. In een proportional hazards model daarentegen geldt dit linear effect op de hazard functie (ratio). Deze veronderstellingen worden misschien gemaakt omwille van de wiskundige eenvoud. In de praktijk kunnen de eigenlijke verbanden echter complexer zijn. Het derde deel van de thesis beschouwt een hybride hazard model waarbij we een parametrische TPA basis hazard verdeling veronderstellen met een flexibele regressiesetting. We onderzoeken de effecten van de covariaten in de tijds- en hazardschaal in parametrische, semi-parametrische en niet-parametrische situaties. De algemene hybride hazardgebaseerde modellen omvatten de drie meest gebruikte overlevingsmodellen: proportional hazard (PH), accelerated failure time (AFT) en accelerated hazards (AH) modellen. We bespreken de schattingsprocedures gebaseerd op de lokale profile likelihood techniek. Op basis van een simulatiestudie onderzoeken we de toepasbaarheid van de methoden. Daarnaast illustreren we het praktische gebruik van de methoden via data voorbeelden
Document URI: http://hdl.handle.net/1942/39017
Category: T1
Type: Theses and Dissertations
Appears in Collections:Research publications

Files in This Item:
File Description SizeFormat 
PhD Final version- Worku Biyadgie EWNETU.pdf
  Until 2027-12-12
Peer-reviewed author version3.06 MBAdobe PDFView/Open    Request a copy
Cover_Worku Biyadgie Ewnetu_Gezamelijk.pdf
  Until 2027-12-12
Published version31.41 kBAdobe PDFView/Open    Request a copy
Show full item record

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.