Show simple item record

Diachronic comparison of synchronic corpora
dc.contributor.advisorČermák, František
dc.creatorKřen, Michal
dc.date.accessioned2020-11-26T19:36:07Z
dc.date.available2020-11-26T19:36:07Z
dc.date.issued2012
dc.identifier.urihttp://hdl.handle.net/20.500.11956/43653
dc.description.abstractThe thesis presents a method for diachronic comparison of synchronic corpora that reflect language of very close time periods. Its primary aim is the assessment of possi- bilities and limitations of language change detection based on the synchronic written SYN-series corpora. The approach is corpus-driven, based on a statistical evaluation of differences among normalized average reduced frequencies of lemmata and lexical combinations. There are several variants of the method applied on various subcorpora of corpus SYN and their results examined in detail. Difficulty of the comparison lies in the influence of corpus composition and the interconnection of changes in language with changes in society. As it is not easy to distinguish the signs of diachronic shift from naturally existing synchronic variability, the statistically discovered significance of frequency differences is additionally verified by querying the base corpora. The interpretation of the results is also adjusted by the knowledge of their exact composition. The conclusions are based mainly on the newspapers as a written text type that is most receptive to the changes. The changes can be characterized as a thematic diversion from the original political and economical orientation of the newspapers towards real- life and free-time topics...en_US
dc.description.abstractPráce představuje metodu pro diachronní srovnání synchronních korpusů zachycu- jících blízké stavy jazyka. Cílem práce je především zhodnotit možnosti a meze de- tekce vývojových tendencí v jazyce na materiálu synchronních psaných korpusů řady SYN. Metodologicky jde o corpus-driven přístup založený na statistickém vyhodno- cení rozdílů mezi normalizovanými průměrnými redukovanými frekvencemi lemmat a lexikálních kombinací. Metoda je aplikována v několika variantách na různě definované subkorpusy korpusu SYN a podrobně vyhodnocena. Provedené srovnání ztěžuje především vliv složení jednotlivých korpusů a provázanost změn v jazyce se změnami společenskými. Protože neumíme spolehlivě odlišit zárodky diachronních posunů od přirozeně existující synchronní variability, je statisticky zjištěná významnost frekvenčních rozdílů jednotlivých výrazů zpětně ověřována na korpusech a interpretace výsledků korigována znalostí jejich přesného složení. Závěry jsou založeny především na publicistice, která je z psaného jazyka nejvíce otevřená změnám. Změny v jazyce publicistiky lze charakterizovat jako tematický od- klon od původní politické a ekonomické orientace směrem k tématům týkajícím se praktického života a využívání volného času spojený se zvyšující se neformálností, která způsobuje posuny ve frekvencích...cs_CZ
dc.languageČeštinacs_CZ
dc.language.isocs_CZ
dc.publisherUniverzita Karlova, Filozofická fakultacs_CZ
dc.subjectsynchronic corporaen_US
dc.subjectdiachronic comparisonen_US
dc.subjectlexical frequenciesen_US
dc.subjectlanguage changeen_US
dc.subjectlanguage variabilityen_US
dc.subjectcorpus compositionen_US
dc.subjectrepresentativenessen_US
dc.subjectsynchronní korpusycs_CZ
dc.subjectdiachronní srovnánícs_CZ
dc.subjectlexikální frekvencecs_CZ
dc.subjectjazykový vývojcs_CZ
dc.subjectjazyková variabilitacs_CZ
dc.subjectsložení korpusucs_CZ
dc.subjectreprezentativnostcs_CZ
dc.titleDiachronní srovnání synchronních korpusůcs_CZ
dc.typedizertační prácecs_CZ
dcterms.created2012
dcterms.dateAccepted2012-05-29
dc.description.departmentInstitute of the Czech National Corpusen_US
dc.description.departmentÚstav českého národního korpusucs_CZ
dc.description.facultyFilozofická fakultacs_CZ
dc.description.facultyFaculty of Artsen_US
dc.identifier.repId120960
dc.title.translatedDiachronic comparison of synchronic corporaen_US
dc.contributor.refereeKučera, Karel
dc.contributor.refereeKrálík, Jan
dc.identifier.aleph001469369
thesis.degree.namePh.D.
thesis.degree.leveldoktorskécs_CZ
thesis.degree.disciplineMatematická lingvistikacs_CZ
thesis.degree.disciplineMathematical Linguisticsen_US
thesis.degree.programFilologiecs_CZ
thesis.degree.programPhilologyen_US
uk.thesis.typedizertační prácecs_CZ
uk.taxonomy.organization-csFilozofická fakulta::Ústav českého národního korpusucs_CZ
uk.taxonomy.organization-enFaculty of Arts::Institute of the Czech National Corpusen_US
uk.faculty-name.csFilozofická fakultacs_CZ
uk.faculty-name.enFaculty of Artsen_US
uk.faculty-abbr.csFFcs_CZ
uk.degree-discipline.csMatematická lingvistikacs_CZ
uk.degree-discipline.enMathematical Linguisticsen_US
uk.degree-program.csFilologiecs_CZ
uk.degree-program.enPhilologyen_US
thesis.grade.csProspěl/acs_CZ
thesis.grade.enPassen_US
uk.abstract.csPráce představuje metodu pro diachronní srovnání synchronních korpusů zachycu- jících blízké stavy jazyka. Cílem práce je především zhodnotit možnosti a meze de- tekce vývojových tendencí v jazyce na materiálu synchronních psaných korpusů řady SYN. Metodologicky jde o corpus-driven přístup založený na statistickém vyhodno- cení rozdílů mezi normalizovanými průměrnými redukovanými frekvencemi lemmat a lexikálních kombinací. Metoda je aplikována v několika variantách na různě definované subkorpusy korpusu SYN a podrobně vyhodnocena. Provedené srovnání ztěžuje především vliv složení jednotlivých korpusů a provázanost změn v jazyce se změnami společenskými. Protože neumíme spolehlivě odlišit zárodky diachronních posunů od přirozeně existující synchronní variability, je statisticky zjištěná významnost frekvenčních rozdílů jednotlivých výrazů zpětně ověřována na korpusech a interpretace výsledků korigována znalostí jejich přesného složení. Závěry jsou založeny především na publicistice, která je z psaného jazyka nejvíce otevřená změnám. Změny v jazyce publicistiky lze charakterizovat jako tematický od- klon od původní politické a ekonomické orientace směrem k tématům týkajícím se praktického života a využívání volného času spojený se zvyšující se neformálností, která způsobuje posuny ve frekvencích...cs_CZ
uk.abstract.enThe thesis presents a method for diachronic comparison of synchronic corpora that reflect language of very close time periods. Its primary aim is the assessment of possi- bilities and limitations of language change detection based on the synchronic written SYN-series corpora. The approach is corpus-driven, based on a statistical evaluation of differences among normalized average reduced frequencies of lemmata and lexical combinations. There are several variants of the method applied on various subcorpora of corpus SYN and their results examined in detail. Difficulty of the comparison lies in the influence of corpus composition and the interconnection of changes in language with changes in society. As it is not easy to distinguish the signs of diachronic shift from naturally existing synchronic variability, the statistically discovered significance of frequency differences is additionally verified by querying the base corpora. The interpretation of the results is also adjusted by the knowledge of their exact composition. The conclusions are based mainly on the newspapers as a written text type that is most receptive to the changes. The changes can be characterized as a thematic diversion from the original political and economical orientation of the newspapers towards real- life and free-time topics...en_US
uk.file-availabilityV
uk.grantorUniverzita Karlova, Filozofická fakulta, Ústav českého národního korpusucs_CZ
thesis.grade.codeP
uk.publication-placePrahacs_CZ
dc.identifier.lisID990014693690106986


Files in this item

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV