Zobrazit minimální záznam

Great citation databases in context of Benford law
dc.contributor.advisorIvánek, Jiří
dc.creatorŠlosar, David Jiří
dc.date.accessioned2025-10-20T07:50:25Z
dc.date.available2025-10-20T07:50:25Z
dc.date.issued2025
dc.identifier.urihttp://hdl.handle.net/20.500.11956/205246
dc.description.abstractThe aim of this study was to verify the validity of Benford's Law in the number of citations in large datasets from three citation databases. Datasets containing more than 112 million records for a ten-year period of publication were downloaded from these databases. Thirty- six types of analyses were performed on the data, which not only verified the validity of Benford's Law in the number of citations in datasets from individual databases, but also identified trends in the level of conformity of citation counts with Benford's Law and differences in conformities between document types and fields. To express the level of conformity of the first significant digits of the number of citations with Benford's Law in thirty-six types of analyses, the MAD (Mean Absolute Deviation) and SSD (Sum Square Deviation) metrics were used. Furthermore, the methodology was enriched with the KLD (Kullback-Liebler Divergence) metric, for which thresholds were set for classification into conformity levels for the number of citations datasets. The last metric used is the optimal β parameter, which not only reflects the distance of the number of citations from Benford's law, but also expresses the "rotation" of this type of data relative to the probability distribution according to Benford's Law. The results indicate the...en_US
dc.description.abstractCílem předložené práce bylo ověřit platnost Benfordova zákona v počtech citací nad velkými datasety ze tří citačních databází. Z těchto databází byly staženy datasety o velikosti více než 112 milionů záznamů za desetileté období roků vydání. Nad daty bylo provedeno 36 typů analýz, kterými byla nejen ověřena platnost Benfordova zákona v počtech citací datasetů z jednotlivých databází, ale také byly zjištěny trendy v míře konformity počtů citací s Benfordovým zákonem a rozdíly v konformitách mezi typy dokumentů a obory. Pro potřeby vyjádření míry konformity prvních signifikantních číslic počtů citací s Benfordovým zákonem v 36 typech analýz byly použity metriky MAD (Mean Absolute Deviation) a SSD (Sum Square Deviation). Dále byla metodologie obohacena o metriku KLD (Kullback-Liebler Divergence) u které byly stanoveny hranice pro zařazení do úrovní konformity pro datasety počtů citací. Poslední použitou metrikou je optimální β parametr takzvaného zobecněného Benfordova zákona, který reflektuje nejen vzdálenost počtů citací od základního Benfordova zákona, ale také vyjadřuje "natočení" počtů citací vůči distribuci pravděpodobností dle základního Benfordova zákona. Výsledky ukazují na platnost Benfordova zákona v počtech citací, ačkoliv shoda distribucí není perfektní. Mezi typy dokumentů se nachází...cs_CZ
dc.languageČeštinacs_CZ
dc.language.isocs_CZ
dc.publisherUniverzita Karlova, Filozofická fakultacs_CZ
dc.subjectBenfordův zákon|scientometrie|citační data|bibliometriecs_CZ
dc.subjectBenford's Law|scientometrics|citation data|bibliometricsen_US
dc.titleVelké citační databáze v kontextu Benfordova zákonacs_CZ
dc.typedizertační prácecs_CZ
dcterms.created2025
dcterms.dateAccepted2025-09-29
dc.description.departmentÚstav informačních studií - studia nových médiícs_CZ
dc.description.departmentInstitute of Information Studies and Librarianship - New Media Studiesen_US
dc.description.facultyFaculty of Artsen_US
dc.description.facultyFilozofická fakultacs_CZ
dc.identifier.repId228335
dc.title.translatedGreat citation databases in context of Benford lawen_US
dc.contributor.refereeŠušol, Jaroslav
dc.contributor.refereeKliegr, Tomáš
thesis.degree.namePh.D.
thesis.degree.leveldoktorskécs_CZ
thesis.degree.disciplineInformation Scienceen_US
thesis.degree.disciplineInformační vědacs_CZ
thesis.degree.programInformační vědacs_CZ
thesis.degree.programInformation Scienceen_US
uk.thesis.typedizertační prácecs_CZ
uk.taxonomy.organization-csFilozofická fakulta::Ústav informačních studií - studia nových médiícs_CZ
uk.taxonomy.organization-enFaculty of Arts::Institute of Information Studies and Librarianship - New Media Studiesen_US
uk.faculty-name.csFilozofická fakultacs_CZ
uk.faculty-name.enFaculty of Artsen_US
uk.faculty-abbr.csFFcs_CZ
uk.degree-discipline.csInformační vědacs_CZ
uk.degree-discipline.enInformation Scienceen_US
uk.degree-program.csInformační vědacs_CZ
uk.degree-program.enInformation Scienceen_US
thesis.grade.csProspěl/acs_CZ
thesis.grade.enPassen_US
uk.abstract.csCílem předložené práce bylo ověřit platnost Benfordova zákona v počtech citací nad velkými datasety ze tří citačních databází. Z těchto databází byly staženy datasety o velikosti více než 112 milionů záznamů za desetileté období roků vydání. Nad daty bylo provedeno 36 typů analýz, kterými byla nejen ověřena platnost Benfordova zákona v počtech citací datasetů z jednotlivých databází, ale také byly zjištěny trendy v míře konformity počtů citací s Benfordovým zákonem a rozdíly v konformitách mezi typy dokumentů a obory. Pro potřeby vyjádření míry konformity prvních signifikantních číslic počtů citací s Benfordovým zákonem v 36 typech analýz byly použity metriky MAD (Mean Absolute Deviation) a SSD (Sum Square Deviation). Dále byla metodologie obohacena o metriku KLD (Kullback-Liebler Divergence) u které byly stanoveny hranice pro zařazení do úrovní konformity pro datasety počtů citací. Poslední použitou metrikou je optimální β parametr takzvaného zobecněného Benfordova zákona, který reflektuje nejen vzdálenost počtů citací od základního Benfordova zákona, ale také vyjadřuje "natočení" počtů citací vůči distribuci pravděpodobností dle základního Benfordova zákona. Výsledky ukazují na platnost Benfordova zákona v počtech citací, ačkoliv shoda distribucí není perfektní. Mezi typy dokumentů se nachází...cs_CZ
uk.abstract.enThe aim of this study was to verify the validity of Benford's Law in the number of citations in large datasets from three citation databases. Datasets containing more than 112 million records for a ten-year period of publication were downloaded from these databases. Thirty- six types of analyses were performed on the data, which not only verified the validity of Benford's Law in the number of citations in datasets from individual databases, but also identified trends in the level of conformity of citation counts with Benford's Law and differences in conformities between document types and fields. To express the level of conformity of the first significant digits of the number of citations with Benford's Law in thirty-six types of analyses, the MAD (Mean Absolute Deviation) and SSD (Sum Square Deviation) metrics were used. Furthermore, the methodology was enriched with the KLD (Kullback-Liebler Divergence) metric, for which thresholds were set for classification into conformity levels for the number of citations datasets. The last metric used is the optimal β parameter, which not only reflects the distance of the number of citations from Benford's law, but also expresses the "rotation" of this type of data relative to the probability distribution according to Benford's Law. The results indicate the...en_US
uk.file-availabilityV
uk.grantorUniverzita Karlova, Filozofická fakulta, Ústav informačních studií - studia nových médiícs_CZ
thesis.grade.codeP
uk.publication-placePrahacs_CZ
uk.thesis.defenceStatusO


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2025 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV