Please use this identifier to cite or link to this item:
http://hdl.handle.net/1942/44172
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | NEVEN, Frank | |
dc.contributor.author | Singh, Kiran | |
dc.date.accessioned | 2024-09-13T07:54:41Z | - |
dc.date.available | 2024-09-13T07:54:41Z | - |
dc.date.issued | 2024 | |
dc.identifier.uri | http://hdl.handle.net/1942/44172 | - |
dc.description.abstract | Dit proefschrift evalueert de effectiviteit en bruikbaarheid van large language models (LLMs) bij data-integratietaken, met een focus op data-extractie. LLMs, gebaseerd op neurale netwerken, worden gebruikt om data uit verschillende bronnen te extraheren en om te zetten voor integratieworkflows. Het onderzoek stelt vier vragen: kunnen LLMs consistent tekst extraheren uit grote documenten, hoe nauwkeurig zijn ze bij het genereren van key-value pairs, hoe presteren open-source versus propriëtaire modellen, en kan menselijke tussenkomst de bruikbaarheid verbeteren. Twee casestudies werden uitgevoerd om de prestaties van verschillende LLMs, zoals OpenAI’s GPT-3 en GPT-4 en open-source modellen van Meta AI en Mistral AI, te testen. Een ontwikkelde LLM-pipeline faciliteert deze experimenten door data-extractie, validatie, inferentie, post-validatie en analyse. Een Human-In-The-Loop (HITL) interface werd gecreëerd om gebruikers te helpen de output van de LLM beter te begrijpen en te evalueren. De resultaten toonden aan dat propriëtaire modellen over het algemeen nauwkeuriger waren dan open-source modellen, met GPT-4 als het beste model. | |
dc.format.mimetype | Application/pdf | |
dc.language | nl | |
dc.publisher | tUL | |
dc.title | Evaluating the efficiency of large language models in data integration tasks | |
dc.type | Theses and Dissertations | |
local.bibliographicCitation.jcat | T2 | |
dc.description.notes | master in de informatica | |
local.type.specified | Master thesis | |
item.fulltext | With Fulltext | - |
item.contributor | Singh, Kiran | - |
item.fullcitation | Singh, Kiran (2024) Evaluating the efficiency of large language models in data integration tasks. | - |
item.accessRights | Open Access | - |
Appears in Collections: | Master theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
9e7c5de7-0860-4a3f-9fd2-5fbcf0db4a76.pdf | 4.35 MB | Adobe PDF | View/Open |
Google ScholarTM
Check
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.