Enhancing Multimodal Video Retrieval Systems: A Framework for AI Model Integration and Transparency

Swaanen, Michiel

Please use this identifier to cite or link to this item: http://hdl.handle.net/1942/44173

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	NEVEN, Frank
dc.contributor.author	Swaanen, Michiel
dc.date.accessioned	2024-09-13T07:54:41Z	-
dc.date.available	2024-09-13T07:54:41Z	-
dc.date.issued	2024
dc.identifier.uri	http://hdl.handle.net/1942/44173	-
dc.description.abstract	Deze thesis introduceert een raamwerk dat het maken van foundation modellen democratiseert, waardoor ook kleinere bedrijven zonder grote rekenkracht en data complexe AI-modellen kunnen gebruiken. Dit systeem integreert diverse AI-modellen en maakt het mogelijk om video's te doorzoeken op basis van inhoudelijke elementen zoals acties en dialogen, in plaats van alleen bestandsnamen. De kern van het raamwerk is de plug-and-play functionaliteit, waardoor ontwikkelaars gemakkelijk nieuwe functionaliteiten kunnen toevoegen zonder dat hertraining nodig is. Dit vergroot de flexibiliteit en aanpasbaarheid van het systeem. Bovendien lost dit raamwerk het blackbox-syndroom op dat vaak geassocieerd wordt met foundation modellen, door transparantie te bieden in hoe beslissingen worden genomen. Een praktijkvoorbeeld toont aan hoe effectief het systeem een zoekopdracht zoals "Jan die fietst op een strand" afhandelt, door relevante videoclips te identificeren en te selecteren. Dit raamwerk markeert een belangrijke vooruitgang in de manier waarop interactie met digitale media plaatsvindt, wat essentieel is voor de toekomstige ontwikkeling van videozoektechnologieën.
dc.format.mimetype	Application/pdf
dc.language	nl
dc.publisher	tUL
dc.title	Enhancing Multimodal Video Retrieval Systems: A Framework for AI Model Integration and Transparency
dc.type	Theses and Dissertations
local.bibliographicCitation.jcat	T2
dc.description.notes	master in de informatica
local.type.specified	Master thesis
item.fullcitation	Swaanen, Michiel (2024) Enhancing Multimodal Video Retrieval Systems: A Framework for AI Model Integration and Transparency.	-
item.fulltext	With Fulltext	-
item.accessRights	Open Access	-
item.contributor	Swaanen, Michiel	-
Appears in Collections:	Master theses

Files in This Item:

File	Description	Size	Format
ca8d7a3b-5bba-4ebe-8178-f74adfb8f201.pdf		5.11 MB	Adobe PDF	View/Open

Show simple item record

Google Scholar^TM

Check

Files in This Item:

Google ScholarTM

Google Scholar^TM