Rozdělení délky vět
Sentence length distribution
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/37760Identifikátory
SIS: 90697
Katalog UK: 990013692980106986
Kolekce
- Kvalifikační práce [11986]
Autor
Vedoucí práce
Oponent práce
Hlubinka, Daniel
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Obecná matematika
Katedra / ústav / klinika
Katedra pravděpodobnosti a matematické statistiky
Datum obhajoby
21. 6. 2011
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
Délky vět, Sichelovo rozdělení, GIGP rozděleníKlíčová slova (anglicky)
Sentence length, Sichel distribution, GIGP distributionV předložené práci studujeme, jestli lze popsat délky vět prozaického textu pomocí některého z pravděpodobnostních rozdělení. Konkrétně se zaměříme na negativně binomické, logaritmicko normální a Sichelovo rozdělení a jejich srovnání. Zvláštní pozornost věnujeme Sichelovu rozdělení, které bylo vytvořeno za účelem popisu bibliometrických dat. Dále v práci podrobně zkoumáme odhady parametrů všech tří rozdělení a následně teoretické výsledky použijeme na konkrétní data (několik textů v češtině a v angličtině). Nakonec testujeme přesnost jednotlivých rozdělení a odhadů parametrů na základě výsledků popsaných v této práci. 1
In the present work we study whether it is possible to describe the lengths of sentences of a prosaic text by a probability distribution. We focus on negative binomial, lognormal and Sichel distributions and their comparison. We study Sichel distribution in detail, because it was introduced as distribution for description of bibliometric data. We also investigate estimation of parameters of all three distributions and then use the theoretical results on specific data (a few texts in Czech and English). Finally, we test the accuracy of the distributions and estimated parameters, using the results given in this work. 1
