Please use this identifier to cite or link to this item:
http://hdl.handle.net/1942/19372
Title: | Big Data Counting : Hoe kunnen we een zeer groot aantal distincte objecten efficiënt tellen? | Authors: | Broeckx, Jana | Advisors: | VAN DEN BUSSCHE, Jan | Issue Date: | 2015 | Publisher: | tUL | Abstract: | Een thesis waarin we bestuderen hoe we het aantal unieke items in een stream efficiënt kunnen tellen. We bekijken eerst voorkennis in verband met hashing, streaming en kanstheorie. Daarna gaan we over op het bestuderen van makkelijkere algoritmes die bv. frequenties in een stream schatten. Zodra we genoeg basiskennis hebben verworven, gaan we over de complexere distinct-count algoritmes. Uiteindelijk implementeren we twee van de distinct count algoritmes die we gebruiken om empirisch te kunnen evalueren gegeven een dataset van het bedrijf Selligent. | Notes: | master in de informatica-databases | Document URI: | http://hdl.handle.net/1942/19372 | Category: | T2 | Type: | Theses and Dissertations |
Appears in Collections: | Master theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
10296582014197.pdf | 3.84 MB | Adobe PDF | View/Open |
Page view(s)
26
checked on Sep 28, 2023
Download(s)
20
checked on Sep 28, 2023
Google ScholarTM
Check
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.