Očekávaná výška binárních vyhledávacích stromů
Expected height of binary search trees
diploma thesis (NOT DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/21785Identifiers
Study Information System: 135969
Collections
- Kvalifikační práce [11242]
Author
Advisor
Referee
Koubek, Václav
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Theoretical Computer Science
Department
Department of Software Engineering
Date of defense
31. 5. 2010
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Fail
V této práci studujeme očekávanou výšku binárních vyhledávacích stromů a některé jejich další vlastnosti. Očekávanou výšku zjišťujeme u nevyvážených stromů, a u dvou asi nejznámějších a nejpoužívanějších variant vyvážených stromů, tj. AVL a červeno-černých stromů. Kromě očekávané hodnoty výšek stromů zjišťujeme i rozptyl výšek stromů, a některé další statistiky. V práci se přikláníme k řešení pomocí experimentů. V textu dále uvádíme všechny nám známé teoretické výsledky. Především se zaměřujeme na srovnávání naměřených hodnot s teoreticky vypočtenými výsledky. U případů, kde teoretické výsledky neexistují, jsme se pokoušíme získat co nejpřesnější odhad. Kromě toho porovnáváme i rozdíly stromů mezi sebou. Okrajově měříme i rychlosti vytváření stromů. V experimentech také zkoumáme závislosti na různých typech vstupních dat, jako jsou setříděná data, či data vygenerovaná z různých typů rozdělení. Pro vyhodnocení výsledků používáme standardní statistické metody, především metodu lineární regrese.
In this thesis we study the expected height and some other qualities of the binary serach trees. We make the inquiry about the expected height by skewed trees and by the two probably best-known and most widely used variations of the balanced trees, it means the AVL and the red-black trees. In addition to the value of the expected height of the trees we found out the scatter of the tree heights and some other statistics. In this thesis we attach to experimental solution of the problems. We also write down all the theoretical results that were known to us. We focus especially on comparing the measured values with the theoretically counted results. We try to acquire as exact assessment as possible in the case of unexisting theoretical results. Besides we compare the di erences between the various trees. We measured speeds of the tree's generation only marginally. We also inquire the dependence on di erent kinds of enter data within the experiments, such as the sorted data or generated data from various sorts of division. We use the standard statistic methods for the interpretation of the results, especially the method of linear regression.