Please use this identifier to cite or link to this item:
http://hdl.handle.net/1942/44173
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | NEVEN, Frank | |
dc.contributor.author | Swaanen, Michiel | |
dc.date.accessioned | 2024-09-13T07:54:41Z | - |
dc.date.available | 2024-09-13T07:54:41Z | - |
dc.date.issued | 2024 | |
dc.identifier.uri | http://hdl.handle.net/1942/44173 | - |
dc.description.abstract | Deze thesis introduceert een raamwerk dat het maken van foundation modellen democratiseert, waardoor ook kleinere bedrijven zonder grote rekenkracht en data complexe AI-modellen kunnen gebruiken. Dit systeem integreert diverse AI-modellen en maakt het mogelijk om video's te doorzoeken op basis van inhoudelijke elementen zoals acties en dialogen, in plaats van alleen bestandsnamen. De kern van het raamwerk is de plug-and-play functionaliteit, waardoor ontwikkelaars gemakkelijk nieuwe functionaliteiten kunnen toevoegen zonder dat hertraining nodig is. Dit vergroot de flexibiliteit en aanpasbaarheid van het systeem. Bovendien lost dit raamwerk het blackbox-syndroom op dat vaak geassocieerd wordt met foundation modellen, door transparantie te bieden in hoe beslissingen worden genomen. Een praktijkvoorbeeld toont aan hoe effectief het systeem een zoekopdracht zoals "Jan die fietst op een strand" afhandelt, door relevante videoclips te identificeren en te selecteren. Dit raamwerk markeert een belangrijke vooruitgang in de manier waarop interactie met digitale media plaatsvindt, wat essentieel is voor de toekomstige ontwikkeling van videozoektechnologieën. | |
dc.format.mimetype | Application/pdf | |
dc.language | nl | |
dc.publisher | tUL | |
dc.title | Enhancing Multimodal Video Retrieval Systems: A Framework for AI Model Integration and Transparency | |
dc.type | Theses and Dissertations | |
local.bibliographicCitation.jcat | T2 | |
dc.description.notes | master in de informatica | |
local.type.specified | Master thesis | |
item.fulltext | With Fulltext | - |
item.contributor | Swaanen, Michiel | - |
item.fullcitation | Swaanen, Michiel (2024) Enhancing Multimodal Video Retrieval Systems: A Framework for AI Model Integration and Transparency. | - |
item.accessRights | Open Access | - |
Appears in Collections: | Master theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ca8d7a3b-5bba-4ebe-8178-f74adfb8f201.pdf | 5.11 MB | Adobe PDF | View/Open |
Google ScholarTM
Check
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.