Rozdělení délky vět
Sentence length distribution
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/37760Identifiers
Study Information System: 90697
CU Caralogue: 990013692980106986
Collections
- Kvalifikační práce [11975]
Author
Advisor
Referee
Hlubinka, Daniel
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
General Mathematics
Department
Department of Probability and Mathematical Statistics
Date of defense
21. 6. 2011
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
Keywords (Czech)
Délky vět, Sichelovo rozdělení, GIGP rozděleníKeywords (English)
Sentence length, Sichel distribution, GIGP distributionV předložené práci studujeme, jestli lze popsat délky vět prozaického textu pomocí některého z pravděpodobnostních rozdělení. Konkrétně se zaměříme na negativně binomické, logaritmicko normální a Sichelovo rozdělení a jejich srovnání. Zvláštní pozornost věnujeme Sichelovu rozdělení, které bylo vytvořeno za účelem popisu bibliometrických dat. Dále v práci podrobně zkoumáme odhady parametrů všech tří rozdělení a následně teoretické výsledky použijeme na konkrétní data (několik textů v češtině a v angličtině). Nakonec testujeme přesnost jednotlivých rozdělení a odhadů parametrů na základě výsledků popsaných v této práci. 1
In the present work we study whether it is possible to describe the lengths of sentences of a prosaic text by a probability distribution. We focus on negative binomial, lognormal and Sichel distributions and their comparison. We study Sichel distribution in detail, because it was introduced as distribution for description of bibliometric data. We also investigate estimation of parameters of all three distributions and then use the theoretical results on specific data (a few texts in Czech and English). Finally, we test the accuracy of the distributions and estimated parameters, using the results given in this work. 1
