Text Style Transfer with Neural Language Models
Přenos Stylu Textu pomocí Neuronových Jazykových Modelů
dizertační práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/197975Identifikátory
SIS: 213388
Kolekce
- Kvalifikační práce [11979]
Autor
Vedoucí práce
Oponent práce
Yamshchikov, Ivan
Fellenz, Sophie
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Computational linguistics
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
1. 4. 2025
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Prospěl/a
Klíčová slova (česky)
transfer stylu textu (TST)|generování přirozeného jazyka (NLG)|zpracování přirozeného jazyka (NLP)|NLG s omezenými zdroji|vícejazyčné NLG|transfer sentimentu|transfer zdvořilosti|detoxifikace|velké jazykové modely (LLM)Klíčová slova (anglicky)
text style transfer (TST)|natural language generation (NLG)|natural language processing (NLP)|low-resource NLG|multilingual NLG|sentiment transfer|politeness transfer|detoxification|large language models (LLMs)Transfer stylu textu (TST) si klade za cíl změnit stylistické vlastnosti textu při za- chování obsahu nezávislého na stylu. I přes nedávný pokrok čelí TST několika výz- vám: nedostatku dat, omezenému pokrytí jazyků, nejednotným evaluačním meto- dám a nedostatečně prozkoumaným praktickým aplikacím. Tato práce se těmto výzvám věnuje prostřednictvím pěti hlavních příspěvků. Nejprve vyvíjíme efek- tivní metody pro TST s využitím neuronových jazykových modelů v prostředí s omezenými zdroji, kde prokazujeme úspěšnost jak s neparalelními, tak s minimál- ními paralelními daty. Dále rozšiřujeme výzkum TST do vícejazyčného prostředí vytvořením datových sad v několika indických jazycích a stanovením benchmarku pro dvě populární podúlohy TST - transfer sentimentu a detoxifikaci textu. Poté zavádíme vylepšené evaluační metriky, které vykazují lepší korelaci s lidským hod- nocením, přičemž zkoumáme využití velkých jazykových modelů jako evaluačních nástrojů. Praktickou využitelnost TST demonstrujeme vyvinutím zdvořilého chat- bota, který využívá transfer zdvořilosti pro generování kontextově vhodných odpo- vědí. Na závěr podáváme komplexní analýzu schopností velkých jazykových modelů v úlohách TST napříč více jazyky, přičemž identifikujeme jejich potenciál i omezení. Naše zjištění posouvají obor kupředu tím, že...
Citace dokumentu
Metadata
Zobrazit celý záznamSouvisející záznamy
Zobrazují se záznamy příbuzné na základě názvu, autora a předmětu.
-
L'interférence de l'anglais sur le français chez les apprenants tchèques du FLE
Výsledek obhajoby: OBHÁJENOMansfeldová, Barbora (Univerzita Karlova, Pedagogická fakulta, 2023)Datum obhajoby: 16. 5. 2023 -
Čeština slovenských mluvčích
Výsledek obhajoby: OBHÁJENOHalušková, Dana (Univerzita Karlova, Filozofická fakulta, 2017)Datum obhajoby: 6. 2. 2017Bakalářská práce Čeština slovenských mluvčích analyzuje psané jazykové projevy v českém jazyce dvou mluvčích slovenského původu na základě poznatků o jazykovém transferu, semikomunikaci a typologii jazykových chyb. První ... -
Ukrajinsko-české interference (syntax)
Výsledek obhajoby: OBHÁJENOParashchak, Yuliia (Univerzita Karlova, Filozofická fakulta, 2021)Datum obhajoby: 6. 9. 2021Tato diplomová práce se zabývá ukrajinsko-českou interferencí na syntaktické úrovni. Teoretická část se věnuje termínům, se kterými pracujeme, vymezuje kontrastivní a chybovou analýzu a zaměřuje se na syntaktické rozdíly ...
