Please use this identifier to cite or link to this item: http://hdl.handle.net/1942/47074
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorVANHOOF, Koenraad
dc.contributor.authorHermans, Ruben
dc.date.accessioned2025-09-08T12:26:45Z-
dc.date.available2025-09-08T12:26:45Z-
dc.date.issued2025
dc.identifier.urihttp://hdl.handle.net/1942/47074-
dc.description.abstractMet de opkomst van grote taalmodellen (LLMs) worden steeds meer onderdelen van data-analyse geautomatiseerd, al blijft de nauwkeurigheid bij complexe taken onzeker. Dit onderzoek evalueert in hoeverre generatieve AI-tools betrouwbare assistenten zijn tijdens de voorbereidende fases van data-analyse: data cleaning en exploratieve data-analyse (EDA). Vier recente modellen — ChatGPT (GPT-4o), Claude (3.7 Sonnet), DeepSeek (V3) en Grok (3) — werden getest op hun vermogen om code te genereren, visuele patronen te interpreteren en statistische tabellen te analyseren. De evaluatie gebeurde via zorgvuldig opgebouwde testcases in R met de Titanic- en Palmer Penguins-datasets. De prestaties werden beoordeeld op nauwkeurigheid en aangevuld met een kwalitatieve analyse van bruikbaarheid, volledigheid en redeneringsdiepte. De resultaten tonen aan dat AI-tools veel basis- cleaning- en EDA-taken accuraat uitvoeren, maar de kwaliteit verschilt sterk per tool en taak. ChatGPT en Claude presteerden het best, met Claude als uitschieter in redenering en volledigheid. DeepSeek was technisch sterk maar zwakker in visuele interpretatie. Grok scoorde goed op numeriek vlak, maar was minder consistent bij grafieken en complexere cleaning. Ondanks beperkingen in datasets en methodologie biedt het onderzoek waardevolle inzichten in de praktische inzetbaarheid van AI bij data-analyse. Vervolgonderzoek kan focussen op iteratieve interactie, meer datavariatie en vergelijking met menselijke output.
dc.format.mimetypeApplication/pdf
dc.languagenl
dc.publisherUHasselt
dc.titleEvaluation of modern tools for data scientists
dc.typeTheses and Dissertations
local.bibliographicCitation.jcatT2
dc.description.notesmaster handelsingenieur in de beleidsinformatica
local.type.specifiedMaster thesis
item.contributorHermans, Ruben-
item.accessRightsOpen Access-
item.fulltextWith Fulltext-
item.fullcitationHermans, Ruben (2025) Evaluation of modern tools for data scientists.-
Appears in Collections:Master theses
Files in This Item:
File Description SizeFormat 
22301d8e-135a-4958-9029-4635123854bd.pdf1.22 MBAdobe PDFView/Open
26196ba4-5bc3-4735-989c-83eae39512df.pdf435.82 kBAdobe PDFView/Open
Show simple item record

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.