Clustering van XML documenten

Please use this identifier to cite or link to this item: http://hdl.handle.net/1942/12733

Title:	Clustering van XML documenten
Authors:	Sijbers, Renaat
Advisors:	NEVEN, Frank
Issue Date:	2011
Publisher:	tUL Diepenbeek
Abstract:	De vraag naar clusteringstechnieken voor XML documenten stijgt vanwege de enorme groei aan repositories op het wereldwijde web. Clustering van dergelijke documenten kent veel toepassingen, waaronder het reconstrueren van schema's voor een groep van documenten die inhoudelijk op elkaar gelijken. Om dit te verwezelijken werden er diverse technieken bedacht die de structurele informatie uit XML documenten kan halen, zodat de afstand oftewel de ongelijkheid tussen de documenten berekend kan worden. In deze thesis worden deze technieken grondig bestudeerd op nauwkeurigheid en snelheid, enerzijds via een theoretische analyse en anderzijds via praktische testen op realistische datasets van documenten. Er wordt dieper ingegaan op de kwaliteiten van Tree Editing benaderingstechnieken en op meerdere alternatieven die mogelijk een antwoord kunnen bieden op de beperkingen van de eerstgenoemde. Een studie uitgevoerd op een applicatie geschreven ten behoeve van deze thesis, sluit de masterproef af.
Notes:	master in de informatica-databases
Document URI:	http://hdl.handle.net/1942/12733
Category:	T2
Type:	Theses and Dissertations
Appears in Collections:	Master theses

Check