Please use this identifier to cite or link to this item: http://hdl.handle.net/1942/47186
Title: Find By Idea: Interpreting AI with Training Sample Proximity in Embedding Space
Authors: Martens, Joren
Advisors: ROVELO RUIZ, Gustavo Alberto
VANACKEN, Davy
Issue Date: 2025
Publisher: tUL
Abstract: Met de toenemende populariteit van LLM-toepassingen zoals ChatGPT en GitHub Copilot, komen veel niet-technische gebruikers voor het eerst in aanraking met deze moderne AI-technieken. Niet iedereen beseft echter dat deze systemen functioneren als een ‘black box', waarbij elke invoer een uitvoer oplevert, maar onduidelijk is hoe die uitvoer tot stand is gekomen. Dit black box-probleem moet niet alleen onderzocht worden om transparanter te worden, maar ook moet aan nieuwe gebruikers duidelijk worden gemaakt wat zij van een LLM mogen verwachten. Deze thesis bespreekt de huidige XAI-technieken die kunnen worden gebruikt om de werking van LLMs te verklaren. Inzicht in hoe deze modellen tot hun uitkomsten komen is essentieel voor transparantie, vertrouwen en verantwoordelijkheid. De focus ligt op het vertrouwen dat gebruikers in de LLM stellen, aangezien nieuwe gebruikers de capaciteiten van het model vaak overschatten en er te veel op vertrouwen. Door de sterke en zwakke punten van deze benaderingen te analyseren, draagt deze thesis bij aan de inspanningen om krachtige taalmodellen begrijpelijker en betrouwbaarder te maken. De belangrijkste bijdrage van dit werk is een gebruiksvriendelijke methode om gebruikers een juiste hoeveelheid vertrouwen te geven in een LLM. Deze methode presenteert gebruikers menselijke trainingsvoorbeelden die semantisch vergelijkbaar zijn met het huidige gesprek.
Notes: master in de informatica
Document URI: http://hdl.handle.net/1942/47186
Category: T2
Type: Theses and Dissertations
Appears in Collections:Master theses

Files in This Item:
File Description SizeFormat 
52a9d37d-01ce-4dc3-a49a-d8f102521bde.pdf2.61 MBAdobe PDFView/Open
Show full item record

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.