Please use this identifier to cite or link to this item: http://hdl.handle.net/1942/21347
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorBURZYKOWSKI, Tomasz-
dc.contributor.authorZHU, Qi-
dc.date.accessioned2016-05-31T13:27:14Z-
dc.date.available2016-05-31T13:27:14Z-
dc.date.issued2010-
dc.identifier.urihttp://hdl.handle.net/1942/21347-
dc.description.abstractIn dit proefschrift ligt de nadruk op de analyse van massa spectrometrie (MS) data. Het gebruiken van dergelijke data voor de studie van prote¨ ınen, kan leiden tot een nieuw inzicht in de moleculaire en cellulaire eigenschappen van biologische processen en mogelijk tot nieuwe biomerkers. Proteomica, de studie van alle aanwezige prote¨ ınen in een cel of weefsel, wordt vaak als een vervolg op genomica (studie van genen en hun expressieniveau) beschouwd. In vergelijking tot genomica, is dit ingewikkelder omdat de hoeveelheid en het aantal unieke eiwitten varieert in tegenstelling tot de genen. Het proteoom, alle aanwezige prote¨ ınen, kan verschillen van weefsel tot weefsel en van moment tot moment. In het begin van de proteomica, werd er vooral onderzoek gedaan naar boodschapper RNA, maar men vond dat er geen of weinig correlatie bestond tussen de hoeveelheid boodschapper RNA en het bijhorende prote¨ ıne (Rogers et al. 2008, Dhingraa et al. 2005). Men weet nu dat de aanwezigheid van boodschapper RNA niet altijd leidt tot de productie van prote¨ ınen en dat de hoeveelheid eiwit afhankelijker is van het coderend gen en de fysiologische toestand van de cel dan van het boodschapper RNA. Recente ontwikkelingen in MS gebaseerde proteomica hebben geleid tot de mogelijkheid om op een geautomatiseerde manier duizenden prote¨ ınen en peptiden gelijktijdig te kwantificeren en te identificeren. Deze mogelijkheden hebben voor nieuwe uitdagingen voor het statistisch onderzoek gezorgd. E´ en van deze uitdagingen is het op een snelle, effici¨ ente en correcte manier conclusies trekken voor deze grote en complexe datasets. Hiernaast kan statistiek ook helpen bij het correct opzetten van massa spectrometrie gerelateerde experimenten. In dit proefwerk stellen we enkele statistische modellen voor die gebruikt kunnen worden voor de interpretatie van MS experimenten van gelabelde en niet-gelabelde peptiden. Het feit dat we niet weten welke peptiden aanwezig zijn en we dus h´ et onderscheidende kenmerk, nl. de massa van een peptide, niet kennen maakt het analyseren van MS data gecompliceerd. Het schatten van de massa zorgt voor een mate van onzekerheid vvi Samenvatting waarmee rekening moet gehouden worden omdat alle andere schatters afhankelijk zijn van de geschatte massa. 18O-labeled MS In dit deel stellen we verscheidene modellen voor die het analyseren van gelabelde peptiden mogelijk maken. Peptidenstalen van verschillende biologische oorsprong worden vaak met Liquid Chromatography Mass Spectrometry geanalyseerd. Om geen rekening te moeten houden met de niet-biologische variaties tussen de verschillende spectra kan men deze stalen, na het labelen, samen verwerken in ´ e´ en spectrum. Dankzij het merken kunnen de peptiden van verschillende stalen maar met dezelfde massa in hetzelfde spectrum van elkaar onderscheiden worden. Er bestaan verschillende manieren om peptiden te labelen. Het enzymatisch labelen met 18O van peptiden is zo’n techniek die nieuw is en zeer veel potentie heeft. We stellen modellen voor die rekeningen houden met de vorm van de pieken, stick en shape en die ofwel op een Bayesiaanse ofwel op een frequentistische manier toegepast kunnen worden. In vergelijking met de methoden van (Mirgorodskaya et al. 2000, Rao et al. 2005, L´ opez-Ferrer et al. 2006, Eckel-Passow et al. 2006, Ramos-Fern´ andez et al. 2007), is er geen nood aan extra experimentele stappen. Hiernaast zijn er nog enkele andere verschillen ten opzichte van de bestaande technieken: • Erwordt rekening gehouden met de mogelijke aanwezigheid van de drie zuurstof isotopen. • De isotoop distributie wordt geschat in plaats van een gemiddelde verdeling te veronderstellen. • Alle parameters kunnen op hetzelfde ogenblik geschat worden en de precisie van de schatters wordt eveneens berekend. • Het heteroscedastisch karakter van de mean-variance functie wordt niet genegeerd. • Dankzij random effects kan de technische en biologische variabiliteit van de spectra bepaald worden.vii Kwantificatie van overlappende peptide in niet-gelabelde MS experimenten Het bepalen of er peptide pieken zijn die overlappen en het scheiden van dergelijke pieken is al tientallen jaren een probleem. Verschillende onderzoekers met verschillende achtergronden hebben voor dit probleem oplossingen voorgesteld, vari¨ erend van aanpassingen maken aan het experiment en of het uitbreiden van het experiment tot het ontwikkelen van statistische modellen. In het tweede deel van deze scriptie worden twee modellen voorgesteld voor MS data met een ongekend aantal peptiden. We beschouwen opnieuw twee voorstellingswijzen van de pieken: stick en shape. Wanneer men gebruik maakt van de stick representation moet men rekening houden met een extra afwijking op de isotopen ratio’s. De oorzaken van deze afwijking zijn het gebruiken van samenvattende statistieken en de veronderstellingen die gemaakt worden. In het geval van de shape representation zijn deze veronderstellingen niet nodig. Maar het Bayesian mixture model levert ook foutieve schatters op en overschat eveneens de precisie. Bayesian model averaging is een oplossing voor dit probleem, wanneer het massaverschil tussen twee overlappende peptiden groot genoeg is, dit wil zeggen wanneer het verschil minstens gelijk is aan de helft van de breedte van de piek. Wanneer men de massa’s van de aanwezige peptiden kent, kan men dit model voor enkelvoudig geladen deeltjes aanpassen voor spectra met meervoudig geladen peptiden. Hiervoor volstaat het aanpassen van de mean structure en de prior distribution. In dergelijke gevallen wordt het model eenvoudiger, doordat men de massa van de peptiden niet meer hoeft te schatten en dus kan veranderen in vaststaande en gekende waarden. De resultaten van deze modellen zijn weliswaar afhankelijk van de kwaliteit van het gebruikte preprocessing algoritme. We steunen namelijk op het feit dat de gevonden pieken correct zijn. In het geval van het algoritme dat voorgesteld is door Valkenborg et al. (2009) betekent dit dat de verhouding tussen een piek en ruis groot genoeg moet zijn om gedetecteerd te kunnen worden.-
dc.language.isoen-
dc.titleStatical Modeling for the Analysis of High-resolution Mass Spectrometry Data-
dc.typeTheses and Dissertations-
local.format.pages341-
local.bibliographicCitation.jcatT1-
local.type.refereedNon-Refereed-
local.type.specifiedPhd thesis-
item.fulltextWith Fulltext-
item.accessRightsOpen Access-
item.contributorZHU, Qi-
item.fullcitationZHU, Qi (2010) Statical Modeling for the Analysis of High-resolution Mass Spectrometry Data.-
Appears in Collections:PhD theses
Research publications
Files in This Item:
File Description SizeFormat 
Qi Zhu.pdf3.67 MBAdobe PDFView/Open
Show simple item record

Page view(s)

46
checked on Nov 7, 2023

Download(s)

24
checked on Nov 7, 2023

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.