Please use this identifier to cite or link to this item:
http://hdl.handle.net/1942/12733
Title: | Clustering van XML documenten | Authors: | Sijbers, Renaat | Advisors: | NEVEN, Frank | Issue Date: | 2011 | Publisher: | tUL Diepenbeek | Abstract: | De vraag naar clusteringstechnieken voor XML documenten stijgt vanwege de enorme groei aan repositories op het wereldwijde web. Clustering van dergelijke documenten kent veel toepassingen, waaronder het reconstrueren van schema's voor een groep van documenten die inhoudelijk op elkaar gelijken. Om dit te verwezelijken werden er diverse technieken bedacht die de structurele informatie uit XML documenten kan halen, zodat de afstand oftewel de ongelijkheid tussen de documenten berekend kan worden. In deze thesis worden deze technieken grondig bestudeerd op nauwkeurigheid en snelheid, enerzijds via een theoretische analyse en anderzijds via praktische testen op realistische datasets van documenten. Er wordt dieper ingegaan op de kwaliteiten van Tree Editing benaderingstechnieken en op meerdere alternatieven die mogelijk een antwoord kunnen bieden op de beperkingen van de eerstgenoemde. Een studie uitgevoerd op een applicatie geschreven ten behoeve van deze thesis, sluit de masterproef af. | Notes: | master in de informatica-databases | Document URI: | http://hdl.handle.net/1942/12733 | Category: | T2 | Type: | Theses and Dissertations |
Appears in Collections: | Master theses |
Show full item record
Google ScholarTM
Check
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.