Please use this identifier to cite or link to this item:
http://hdl.handle.net/1942/47188
Title: | Adding Parallelism to Shredded Yannakakis | Authors: | Van Gastel, Max | Advisors: | VANSUMMEREN, Stijn | Issue Date: | 2025 | Publisher: | tUL | Abstract: | Join-operaties zijn een belangrijk deel van query engines, ze laten ons toe om data te combineren vanuit verschillende tabellen. Met dat de datasets die we gebruiken groeien, wordt het belangrijk dat de efficiëntie van deze operatoren meegroeit. Hiervoor bestaan algoritmen als Yannakakis' algoritme die deze berekeningen kunnen versnellen. Recent werk heeft een aangepaste versie van het algoritme gemaakt om het bruikbaar te maken in de praktijk. Om dit mogelijks nog verder te versnellen, kunnen we berekeningen in parallel laten verlopen. Deze thesis heeft als doel om parallellisme te implementeren in de bestaande implementatie van Shredded Yannakakis in Apache DataFusion. Hiervoor werd een exchange operator gemaakt die werkt als meta-operator, hij zal data partitioneren en parallelle werkers opstarten die de partities tegelijk kunnen verwerken. De operator werd dan in de 2-phase NSA plannen die bij Shredded Yannakakis horen verwerkt. Evaluatie van de parallelle runtimes toonde aan dat verticale en horizontale parallellisme aanwezig was via de nieuwe operator, waardoor de meeste runtimes versterkt werden. Het kiezen van het correcte aantal partities om de data in op te splitsen bleek een belangrijke factor te zijn in de efficiëntie van de parallellisatie. Uit deze resultaten kunnen we ook verder bewijzen dat een correcte integratie van parallellisme tijdswinsten kan opbrengen in praktische query engines. | Notes: | master in de informatica | Document URI: | http://hdl.handle.net/1942/47188 | Category: | T2 | Type: | Theses and Dissertations |
Appears in Collections: | Master theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
376f63fd-bd4d-4ed4-9b00-22a6e4588b9c.pdf | 6.69 MB | Adobe PDF | View/Open |
Google ScholarTM
Check
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.