| dc.contributor.advisor | Ivánek, Jiří | |
| dc.creator | Šlosar, David Jiří | |
| dc.date.accessioned | 2025-10-20T07:50:25Z | |
| dc.date.available | 2025-10-20T07:50:25Z | |
| dc.date.issued | 2025 | |
| dc.identifier.uri | http://hdl.handle.net/20.500.11956/205246 | |
| dc.description.abstract | The aim of this study was to verify the validity of Benford's Law in the number of citations in large datasets from three citation databases. Datasets containing more than 112 million records for a ten-year period of publication were downloaded from these databases. Thirty- six types of analyses were performed on the data, which not only verified the validity of Benford's Law in the number of citations in datasets from individual databases, but also identified trends in the level of conformity of citation counts with Benford's Law and differences in conformities between document types and fields. To express the level of conformity of the first significant digits of the number of citations with Benford's Law in thirty-six types of analyses, the MAD (Mean Absolute Deviation) and SSD (Sum Square Deviation) metrics were used. Furthermore, the methodology was enriched with the KLD (Kullback-Liebler Divergence) metric, for which thresholds were set for classification into conformity levels for the number of citations datasets. The last metric used is the optimal β parameter, which not only reflects the distance of the number of citations from Benford's law, but also expresses the "rotation" of this type of data relative to the probability distribution according to Benford's Law. The results indicate the... | en_US |
| dc.description.abstract | Cílem předložené práce bylo ověřit platnost Benfordova zákona v počtech citací nad velkými datasety ze tří citačních databází. Z těchto databází byly staženy datasety o velikosti více než 112 milionů záznamů za desetileté období roků vydání. Nad daty bylo provedeno 36 typů analýz, kterými byla nejen ověřena platnost Benfordova zákona v počtech citací datasetů z jednotlivých databází, ale také byly zjištěny trendy v míře konformity počtů citací s Benfordovým zákonem a rozdíly v konformitách mezi typy dokumentů a obory. Pro potřeby vyjádření míry konformity prvních signifikantních číslic počtů citací s Benfordovým zákonem v 36 typech analýz byly použity metriky MAD (Mean Absolute Deviation) a SSD (Sum Square Deviation). Dále byla metodologie obohacena o metriku KLD (Kullback-Liebler Divergence) u které byly stanoveny hranice pro zařazení do úrovní konformity pro datasety počtů citací. Poslední použitou metrikou je optimální β parametr takzvaného zobecněného Benfordova zákona, který reflektuje nejen vzdálenost počtů citací od základního Benfordova zákona, ale také vyjadřuje "natočení" počtů citací vůči distribuci pravděpodobností dle základního Benfordova zákona. Výsledky ukazují na platnost Benfordova zákona v počtech citací, ačkoliv shoda distribucí není perfektní. Mezi typy dokumentů se nachází... | cs_CZ |
| dc.language | Čeština | cs_CZ |
| dc.language.iso | cs_CZ | |
| dc.publisher | Univerzita Karlova, Filozofická fakulta | cs_CZ |
| dc.subject | Benfordův zákon|scientometrie|citační data|bibliometrie | cs_CZ |
| dc.subject | Benford's Law|scientometrics|citation data|bibliometrics | en_US |
| dc.title | Velké citační databáze v kontextu Benfordova zákona | cs_CZ |
| dc.type | dizertační práce | cs_CZ |
| dcterms.created | 2025 | |
| dcterms.dateAccepted | 2025-09-29 | |
| dc.description.department | Ústav informačních studií - studia nových médií | cs_CZ |
| dc.description.department | Institute of Information Studies and Librarianship - New Media Studies | en_US |
| dc.description.faculty | Faculty of Arts | en_US |
| dc.description.faculty | Filozofická fakulta | cs_CZ |
| dc.identifier.repId | 228335 | |
| dc.title.translated | Great citation databases in context of Benford law | en_US |
| dc.contributor.referee | Šušol, Jaroslav | |
| dc.contributor.referee | Kliegr, Tomáš | |
| thesis.degree.name | Ph.D. | |
| thesis.degree.level | doktorské | cs_CZ |
| thesis.degree.discipline | Information Science | en_US |
| thesis.degree.discipline | Informační věda | cs_CZ |
| thesis.degree.program | Informační věda | cs_CZ |
| thesis.degree.program | Information Science | en_US |
| uk.thesis.type | dizertační práce | cs_CZ |
| uk.taxonomy.organization-cs | Filozofická fakulta::Ústav informačních studií - studia nových médií | cs_CZ |
| uk.taxonomy.organization-en | Faculty of Arts::Institute of Information Studies and Librarianship - New Media Studies | en_US |
| uk.faculty-name.cs | Filozofická fakulta | cs_CZ |
| uk.faculty-name.en | Faculty of Arts | en_US |
| uk.faculty-abbr.cs | FF | cs_CZ |
| uk.degree-discipline.cs | Informační věda | cs_CZ |
| uk.degree-discipline.en | Information Science | en_US |
| uk.degree-program.cs | Informační věda | cs_CZ |
| uk.degree-program.en | Information Science | en_US |
| thesis.grade.cs | Prospěl/a | cs_CZ |
| thesis.grade.en | Pass | en_US |
| uk.abstract.cs | Cílem předložené práce bylo ověřit platnost Benfordova zákona v počtech citací nad velkými datasety ze tří citačních databází. Z těchto databází byly staženy datasety o velikosti více než 112 milionů záznamů za desetileté období roků vydání. Nad daty bylo provedeno 36 typů analýz, kterými byla nejen ověřena platnost Benfordova zákona v počtech citací datasetů z jednotlivých databází, ale také byly zjištěny trendy v míře konformity počtů citací s Benfordovým zákonem a rozdíly v konformitách mezi typy dokumentů a obory. Pro potřeby vyjádření míry konformity prvních signifikantních číslic počtů citací s Benfordovým zákonem v 36 typech analýz byly použity metriky MAD (Mean Absolute Deviation) a SSD (Sum Square Deviation). Dále byla metodologie obohacena o metriku KLD (Kullback-Liebler Divergence) u které byly stanoveny hranice pro zařazení do úrovní konformity pro datasety počtů citací. Poslední použitou metrikou je optimální β parametr takzvaného zobecněného Benfordova zákona, který reflektuje nejen vzdálenost počtů citací od základního Benfordova zákona, ale také vyjadřuje "natočení" počtů citací vůči distribuci pravděpodobností dle základního Benfordova zákona. Výsledky ukazují na platnost Benfordova zákona v počtech citací, ačkoliv shoda distribucí není perfektní. Mezi typy dokumentů se nachází... | cs_CZ |
| uk.abstract.en | The aim of this study was to verify the validity of Benford's Law in the number of citations in large datasets from three citation databases. Datasets containing more than 112 million records for a ten-year period of publication were downloaded from these databases. Thirty- six types of analyses were performed on the data, which not only verified the validity of Benford's Law in the number of citations in datasets from individual databases, but also identified trends in the level of conformity of citation counts with Benford's Law and differences in conformities between document types and fields. To express the level of conformity of the first significant digits of the number of citations with Benford's Law in thirty-six types of analyses, the MAD (Mean Absolute Deviation) and SSD (Sum Square Deviation) metrics were used. Furthermore, the methodology was enriched with the KLD (Kullback-Liebler Divergence) metric, for which thresholds were set for classification into conformity levels for the number of citations datasets. The last metric used is the optimal β parameter, which not only reflects the distance of the number of citations from Benford's law, but also expresses the "rotation" of this type of data relative to the probability distribution according to Benford's Law. The results indicate the... | en_US |
| uk.file-availability | V | |
| uk.grantor | Univerzita Karlova, Filozofická fakulta, Ústav informačních studií - studia nových médií | cs_CZ |
| thesis.grade.code | P | |
| uk.publication-place | Praha | cs_CZ |
| uk.thesis.defenceStatus | O | |