Please use this identifier to cite or link to this item:
http://hdl.handle.net/1942/47074
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | VANHOOF, Koenraad | |
dc.contributor.author | Hermans, Ruben | |
dc.date.accessioned | 2025-09-08T12:26:45Z | - |
dc.date.available | 2025-09-08T12:26:45Z | - |
dc.date.issued | 2025 | |
dc.identifier.uri | http://hdl.handle.net/1942/47074 | - |
dc.description.abstract | Met de opkomst van grote taalmodellen (LLMs) worden steeds meer onderdelen van data-analyse geautomatiseerd, al blijft de nauwkeurigheid bij complexe taken onzeker. Dit onderzoek evalueert in hoeverre generatieve AI-tools betrouwbare assistenten zijn tijdens de voorbereidende fases van data-analyse: data cleaning en exploratieve data-analyse (EDA). Vier recente modellen — ChatGPT (GPT-4o), Claude (3.7 Sonnet), DeepSeek (V3) en Grok (3) — werden getest op hun vermogen om code te genereren, visuele patronen te interpreteren en statistische tabellen te analyseren. De evaluatie gebeurde via zorgvuldig opgebouwde testcases in R met de Titanic- en Palmer Penguins-datasets. De prestaties werden beoordeeld op nauwkeurigheid en aangevuld met een kwalitatieve analyse van bruikbaarheid, volledigheid en redeneringsdiepte. De resultaten tonen aan dat AI-tools veel basis- cleaning- en EDA-taken accuraat uitvoeren, maar de kwaliteit verschilt sterk per tool en taak. ChatGPT en Claude presteerden het best, met Claude als uitschieter in redenering en volledigheid. DeepSeek was technisch sterk maar zwakker in visuele interpretatie. Grok scoorde goed op numeriek vlak, maar was minder consistent bij grafieken en complexere cleaning. Ondanks beperkingen in datasets en methodologie biedt het onderzoek waardevolle inzichten in de praktische inzetbaarheid van AI bij data-analyse. Vervolgonderzoek kan focussen op iteratieve interactie, meer datavariatie en vergelijking met menselijke output. | |
dc.format.mimetype | Application/pdf | |
dc.language | nl | |
dc.publisher | UHasselt | |
dc.title | Evaluation of modern tools for data scientists | |
dc.type | Theses and Dissertations | |
local.bibliographicCitation.jcat | T2 | |
dc.description.notes | master handelsingenieur in de beleidsinformatica | |
local.type.specified | Master thesis | |
item.contributor | Hermans, Ruben | - |
item.accessRights | Open Access | - |
item.fulltext | With Fulltext | - |
item.fullcitation | Hermans, Ruben (2025) Evaluation of modern tools for data scientists. | - |
Appears in Collections: | Master theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
22301d8e-135a-4958-9029-4635123854bd.pdf | 1.22 MB | Adobe PDF | View/Open | |
26196ba4-5bc3-4735-989c-83eae39512df.pdf | 435.82 kB | Adobe PDF | View/Open |
Google ScholarTM
Check
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.