Find By Idea: Interpreting AI with Training Sample Proximity in Embedding Space

Martens, Joren

Please use this identifier to cite or link to this item: http://hdl.handle.net/1942/47186

Title:	Find By Idea: Interpreting AI with Training Sample Proximity in Embedding Space
Authors:	Martens, Joren
Advisors:	ROVELO RUIZ, Gustavo Alberto VANACKEN, Davy
Issue Date:	2025
Publisher:	tUL
Abstract:	Met de toenemende populariteit van LLM-toepassingen zoals ChatGPT en GitHub Copilot, komen veel niet-technische gebruikers voor het eerst in aanraking met deze moderne AI-technieken. Niet iedereen beseft echter dat deze systemen functioneren als een ‘black box', waarbij elke invoer een uitvoer oplevert, maar onduidelijk is hoe die uitvoer tot stand is gekomen. Dit black box-probleem moet niet alleen onderzocht worden om transparanter te worden, maar ook moet aan nieuwe gebruikers duidelijk worden gemaakt wat zij van een LLM mogen verwachten. Deze thesis bespreekt de huidige XAI-technieken die kunnen worden gebruikt om de werking van LLMs te verklaren. Inzicht in hoe deze modellen tot hun uitkomsten komen is essentieel voor transparantie, vertrouwen en verantwoordelijkheid. De focus ligt op het vertrouwen dat gebruikers in de LLM stellen, aangezien nieuwe gebruikers de capaciteiten van het model vaak overschatten en er te veel op vertrouwen. Door de sterke en zwakke punten van deze benaderingen te analyseren, draagt deze thesis bij aan de inspanningen om krachtige taalmodellen begrijpelijker en betrouwbaarder te maken. De belangrijkste bijdrage van dit werk is een gebruiksvriendelijke methode om gebruikers een juiste hoeveelheid vertrouwen te geven in een LLM. Deze methode presenteert gebruikers menselijke trainingsvoorbeelden die semantisch vergelijkbaar zijn met het huidige gesprek.
Notes:	master in de informatica
Document URI:	http://hdl.handle.net/1942/47186
Category:	T2
Type:	Theses and Dissertations
Appears in Collections:	Master theses

Files in This Item:

File	Description	Size	Format
52a9d37d-01ce-4dc3-a49a-d8f102521bde.pdf		2.61 MB	Adobe PDF	View/Open

Show full item record

Google Scholar^TM

Check

Files in This Item:

Google ScholarTM

Google Scholar^TM