Please use this identifier to cite or link to this item: http://hdl.handle.net/1942/19372
Title: Big Data Counting : Hoe kunnen we een zeer groot aantal distincte objecten efficiënt tellen?
Authors: Broeckx, Jana
Advisors: VAN DEN BUSSCHE, Jan
Issue Date: 2015
Publisher: tUL
Abstract: Een thesis waarin we bestuderen hoe we het aantal unieke items in een stream efficiënt kunnen tellen. We bekijken eerst voorkennis in verband met hashing, streaming en kanstheorie. Daarna gaan we over op het bestuderen van makkelijkere algoritmes die bv. frequenties in een stream schatten. Zodra we genoeg basiskennis hebben verworven, gaan we over de complexere distinct-count algoritmes. Uiteindelijk implementeren we twee van de distinct count algoritmes die we gebruiken om empirisch te kunnen evalueren gegeven een dataset van het bedrijf Selligent.
Notes: master in de informatica-databases
Document URI: http://hdl.handle.net/1942/19372
Category: T2
Type: Theses and Dissertations
Appears in Collections:Master theses

Files in This Item:
File Description SizeFormat 
10296582014197.pdf3.84 MBAdobe PDFView/Open
Show full item record

Page view(s)

26
checked on Sep 28, 2023

Download(s)

20
checked on Sep 28, 2023

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.