Show simple item record

Parallel bi-directional Czech-French and French-Czech corpus: definition, design, buildup and exploitation
Návrh, vytvoření a využití francouzskočeského a česko-francouzského paralelního korpusu
dc.contributor.advisorPognan, Patrice
dc.creatorSvášek, Martin
dc.date.accessioned2018-10-29T23:49:35Z
dc.date.available2018-10-29T23:49:35Z
dc.date.issued2007
dc.identifier.urihttp://hdl.handle.net/20.500.11956/12105
dc.description.abstractDisertační práce sestává ze tří částí, jež odpovídají názvu. Autor nejprve představuje koncepci paralelního korpusu a na obecné rovině jej definuje jakožto soubor textů v několika jazycích (nejméně dvou) tvořený dvojicemi originál-překlad. Je uvedena terminologie pro pojmenování různých druhů textových souborů ve víceru jazyků a k získání obecného přehledu v dané oblasti se mohou čtenáři seznámit s paralelními korpusy, které v současné době existují. Následně je definován francouzsko-český a česko-francouzský paralelní korpus (Fratchque), a to vzhledem k jeho budoucímu použití pro jazykovědný výzkum, zejména k vyhledávání nesklonných výrazů, jež představují autorův střed zájmu. Fratchque je paralelní korpus beletristických textů psaných francouzsky a česky; autor uvádí výčet obtíží, jež zamezily tomu, aby korpus obsahoval i jiné druhy textů. Korpus existuje pouze v digitální podobě, aby umožnil vyhledávání za pomoci počítače. Snaží se odrážet moderní jazyk, proto obsahuje pouze texty, které pocházejí z doby po roce 1945. Struktura souborů uložených na pevném disku, již spravuje program ParaConc, může být v budoucnu obohacena o nové dvojice českofrancouzských či francouzsko-českých textů. Není explicitně označkována XML značkami, což je ospravedlněno tím, že v současné době značkování není třeba; korpusový...cs_CZ
dc.description.abstractAccording to the title, the thesis is composed of three parts. At the beginning the author introduces the concept of a parallel corpus defining it as a set of texts in different (at least two) languages, composed of original-translation couples. A terminology is provided to name different sets of texts in different languages. To have a general overview of this specific field, readers can be acquainted with the present existing parallel corpus. A definition of the project for creating a bidirectional French-Czech Czech-French parallel corpus is given in order to use it in linguistic research, notably research upon inflected expressions. French and Czech texts composing the parallel corpus Fratchque come from literature; the author also gives the explanation regarding the reason why other kinds of texts have not been taken into account. This corpus, conceived for PC-based researches, exists only in digital format. Having in mind the purpose of representing modern language, only texts after the year 1945 have been selected. New couples of French-Czech Czech-French texts could be easily added thanks to the files structure stored on a hard disk and managed by ParaConc. The corpus is not marked up explicitly by XML tags because the tagging is not necessary for the proper functioning of ParaConc - this step,...en_US
dc.languageFrenchcs_CZ
dc.language.isofr_FR
dc.publisherUniverzita Karlova, Filozofická fakultacs_CZ
dc.titleDéfinition, élaboration et exploitation d'un corpus parallèle bidirectionnel français - tchèque tchèque françaisfr_FR
dc.typedizertační prácecs_CZ
dcterms.created2007
dcterms.dateAccepted2007-12-07
dc.description.departmentInstitute of the Czech National Corpusen_US
dc.description.departmentÚstav českého národního korpusucs_CZ
dc.description.facultyFilozofická fakultacs_CZ
dc.description.facultyFaculty of Artsen_US
dc.identifier.repId25111
dc.title.translatedParallel bi-directional Czech-French and French-Czech corpus: definition, design, buildup and exploitationen_US
dc.title.translatedNávrh, vytvoření a využití francouzskočeského a česko-francouzského paralelního korpusucs_CZ
dc.contributor.refereeHajičová, Eva
dc.contributor.refereeLeonard, Jean Leonard
dc.identifier.aleph001007621
thesis.degree.namePh.D.
thesis.degree.leveldoktorskécs_CZ
thesis.degree.disciplineMathematical Linguisticsen_US
thesis.degree.disciplineMatematická lingvistikacs_CZ
thesis.degree.programPhilologyen_US
thesis.degree.programFilologiecs_CZ
uk.thesis.typedizertační prácecs_CZ
uk.taxonomy.organization-csFilozofická fakulta::Ústav českého národního korpusucs_CZ
uk.taxonomy.organization-enFaculty of Arts::Institute of the Czech National Corpusen_US
uk.faculty-name.csFilozofická fakultacs_CZ
uk.faculty-name.enFaculty of Artsen_US
uk.faculty-abbr.csFFcs_CZ
uk.degree-discipline.csMatematická lingvistikacs_CZ
uk.degree-discipline.enMathematical Linguisticsen_US
uk.degree-program.csFilologiecs_CZ
uk.degree-program.enPhilologyen_US
thesis.grade.csProspěl/acs_CZ
thesis.grade.enPassen_US
uk.abstract.csDisertační práce sestává ze tří částí, jež odpovídají názvu. Autor nejprve představuje koncepci paralelního korpusu a na obecné rovině jej definuje jakožto soubor textů v několika jazycích (nejméně dvou) tvořený dvojicemi originál-překlad. Je uvedena terminologie pro pojmenování různých druhů textových souborů ve víceru jazyků a k získání obecného přehledu v dané oblasti se mohou čtenáři seznámit s paralelními korpusy, které v současné době existují. Následně je definován francouzsko-český a česko-francouzský paralelní korpus (Fratchque), a to vzhledem k jeho budoucímu použití pro jazykovědný výzkum, zejména k vyhledávání nesklonných výrazů, jež představují autorův střed zájmu. Fratchque je paralelní korpus beletristických textů psaných francouzsky a česky; autor uvádí výčet obtíží, jež zamezily tomu, aby korpus obsahoval i jiné druhy textů. Korpus existuje pouze v digitální podobě, aby umožnil vyhledávání za pomoci počítače. Snaží se odrážet moderní jazyk, proto obsahuje pouze texty, které pocházejí z doby po roce 1945. Struktura souborů uložených na pevném disku, již spravuje program ParaConc, může být v budoucnu obohacena o nové dvojice českofrancouzských či francouzsko-českých textů. Není explicitně označkována XML značkami, což je ospravedlněno tím, že v současné době značkování není třeba; korpusový...cs_CZ
uk.abstract.enAccording to the title, the thesis is composed of three parts. At the beginning the author introduces the concept of a parallel corpus defining it as a set of texts in different (at least two) languages, composed of original-translation couples. A terminology is provided to name different sets of texts in different languages. To have a general overview of this specific field, readers can be acquainted with the present existing parallel corpus. A definition of the project for creating a bidirectional French-Czech Czech-French parallel corpus is given in order to use it in linguistic research, notably research upon inflected expressions. French and Czech texts composing the parallel corpus Fratchque come from literature; the author also gives the explanation regarding the reason why other kinds of texts have not been taken into account. This corpus, conceived for PC-based researches, exists only in digital format. Having in mind the purpose of representing modern language, only texts after the year 1945 have been selected. New couples of French-Czech Czech-French texts could be easily added thanks to the files structure stored on a hard disk and managed by ParaConc. The corpus is not marked up explicitly by XML tags because the tagging is not necessary for the proper functioning of ParaConc - this step,...en_US
uk.file-availabilityV
uk.publication.placePrahacs_CZ
uk.grantorUniverzita Karlova, Filozofická fakulta, Ústav českého národního korpusucs_CZ
thesis.grade.codeP
dc.identifier.lisID990010076210106986


Files in this item

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV