Please use this identifier to cite or link to this item: http://hdl.handle.net/1942/44172
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorNEVEN, Frank
dc.contributor.authorSingh, Kiran
dc.date.accessioned2024-09-13T07:54:41Z-
dc.date.available2024-09-13T07:54:41Z-
dc.date.issued2024
dc.identifier.urihttp://hdl.handle.net/1942/44172-
dc.description.abstractDit proefschrift evalueert de effectiviteit en bruikbaarheid van large language models (LLMs) bij data-integratietaken, met een focus op data-extractie. LLMs, gebaseerd op neurale netwerken, worden gebruikt om data uit verschillende bronnen te extraheren en om te zetten voor integratieworkflows. Het onderzoek stelt vier vragen: kunnen LLMs consistent tekst extraheren uit grote documenten, hoe nauwkeurig zijn ze bij het genereren van key-value pairs, hoe presteren open-source versus propriëtaire modellen, en kan menselijke tussenkomst de bruikbaarheid verbeteren. Twee casestudies werden uitgevoerd om de prestaties van verschillende LLMs, zoals OpenAI’s GPT-3 en GPT-4 en open-source modellen van Meta AI en Mistral AI, te testen. Een ontwikkelde LLM-pipeline faciliteert deze experimenten door data-extractie, validatie, inferentie, post-validatie en analyse. Een Human-In-The-Loop (HITL) interface werd gecreëerd om gebruikers te helpen de output van de LLM beter te begrijpen en te evalueren. De resultaten toonden aan dat propriëtaire modellen over het algemeen nauwkeuriger waren dan open-source modellen, met GPT-4 als het beste model.
dc.format.mimetypeApplication/pdf
dc.languagenl
dc.publishertUL
dc.titleEvaluating the efficiency of large language models in data integration tasks
dc.typeTheses and Dissertations
local.bibliographicCitation.jcatT2
dc.description.notesmaster in de informatica
local.type.specifiedMaster thesis
item.fulltextWith Fulltext-
item.contributorSingh, Kiran-
item.fullcitationSingh, Kiran (2024) Evaluating the efficiency of large language models in data integration tasks.-
item.accessRightsOpen Access-
Appears in Collections:Master theses
Files in This Item:
File Description SizeFormat 
9e7c5de7-0860-4a3f-9fd2-5fbcf0db4a76.pdf4.35 MBAdobe PDFView/Open
Show simple item record

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.