Evaluation of modern tools for data scientists

Hermans, Ruben

Please use this identifier to cite or link to this item: http://hdl.handle.net/1942/47074

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	VANHOOF, Koenraad
dc.contributor.author	Hermans, Ruben
dc.date.accessioned	2025-09-08T12:26:45Z	-
dc.date.available	2025-09-08T12:26:45Z	-
dc.date.issued	2025
dc.identifier.uri	http://hdl.handle.net/1942/47074	-
dc.description.abstract	Met de opkomst van grote taalmodellen (LLMs) worden steeds meer onderdelen van data-analyse geautomatiseerd, al blijft de nauwkeurigheid bij complexe taken onzeker. Dit onderzoek evalueert in hoeverre generatieve AI-tools betrouwbare assistenten zijn tijdens de voorbereidende fases van data-analyse: data cleaning en exploratieve data-analyse (EDA). Vier recente modellen — ChatGPT (GPT-4o), Claude (3.7 Sonnet), DeepSeek (V3) en Grok (3) — werden getest op hun vermogen om code te genereren, visuele patronen te interpreteren en statistische tabellen te analyseren. De evaluatie gebeurde via zorgvuldig opgebouwde testcases in R met de Titanic- en Palmer Penguins-datasets. De prestaties werden beoordeeld op nauwkeurigheid en aangevuld met een kwalitatieve analyse van bruikbaarheid, volledigheid en redeneringsdiepte. De resultaten tonen aan dat AI-tools veel basis- cleaning- en EDA-taken accuraat uitvoeren, maar de kwaliteit verschilt sterk per tool en taak. ChatGPT en Claude presteerden het best, met Claude als uitschieter in redenering en volledigheid. DeepSeek was technisch sterk maar zwakker in visuele interpretatie. Grok scoorde goed op numeriek vlak, maar was minder consistent bij grafieken en complexere cleaning. Ondanks beperkingen in datasets en methodologie biedt het onderzoek waardevolle inzichten in de praktische inzetbaarheid van AI bij data-analyse. Vervolgonderzoek kan focussen op iteratieve interactie, meer datavariatie en vergelijking met menselijke output.
dc.format.mimetype	Application/pdf
dc.language	nl
dc.publisher	UHasselt
dc.title	Evaluation of modern tools for data scientists
dc.type	Theses and Dissertations
local.bibliographicCitation.jcat	T2
dc.description.notes	master handelsingenieur in de beleidsinformatica
local.type.specified	Master thesis
item.fulltext	With Fulltext	-
item.contributor	Hermans, Ruben	-
item.fullcitation	Hermans, Ruben (2025) Evaluation of modern tools for data scientists.	-
item.accessRights	Open Access	-
Appears in Collections:	Master theses

Files in This Item:

File	Description	Size	Format
22301d8e-135a-4958-9029-4635123854bd.pdf		1.22 MB	Adobe PDF	View/Open
26196ba4-5bc3-4735-989c-83eae39512df.pdf		435.82 kB	Adobe PDF	View/Open

Show simple item record

Google Scholar^TM

Check

Files in This Item:

Google ScholarTM

Google Scholar^TM