Understanding the detection of generated text and its biases
Porozumění detekci generovaného textu a její zaujatosti
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/202771Identifikátory
SIS: 272803
Kolekce
- Kvalifikační práce [11978]
Autor
Vedoucí práce
Oponent práce
Kasner, Zdeněk
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Informatika - Umělá inteligence
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
8. 9. 2025
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
detekce generovaného textu|detekce plagiátorství|GPT|BERT|zaujatostKlíčová slova (anglicky)
generated text detection|plagiarism detection|GPT|BERT|biasPo uvedení ChatGPT - chatbota založeného na modelu GPT-3.5 - a jeho následném nárůstu popularity se objevily obavy z možného zneužití této služby, zejména v oblasti plagiátorství v akademickém prostředí. Díky přirozeně znějící generaci textu je pro člověka obtížné rozlišit mezi textem napsaným člověkem a generovaným textem. Naproti tomu metody strojového učení se ukázaly být do určité míry přesné. Dřívější výzkumy však uvádějí, že tyto metody se opírají o míru perplexity a mají tendenci být zaujaté vůči nerodilým mluvčím, jejichž texty mívají nižší perplexitu. V této práci se k těmto tvrzením vracíme po dvou letech, konkrétně v kontextu českého jazyka. Vytváříme detektory ze tří různých skupin a nezjišťujeme žádnou systematickou zaujatost vůči nerodilým mluvčím. Dále ukazujeme, že perplexita textů českých nerodilých mluvčích není nižší než u rodilých mluvčích. Nakonec demonstrujeme, že naše detektory fungují efektivně i bez spoléhání se na perplexitu.
Following the release of ChatGPT - a chatbot based on GPT-3.5 - and its subsequent growth in popularity, concerns have emerged about the possible misuse of the service, particularly for plagiarism in academia. Given the natural-sounding text generation, the distinction between human-written and generated text is challenging for humans. In contrast, machine-learning methods proved to be accurate to some extent. However, prior work states that these methods rely on perplexity and tend to be biased against non- native speakers, whose texts often have lower perplexities. In this thesis, we revisit these statements after two years, specifically in the Czech language setting. We construct detectors from three separate families and find no systematic bias against non-native speakers. We further show that the perplexity of the texts from Czech non-native speakers is not lower than that of the native ones. Finally, we demonstrate that our detectors function effectively without relying on perplexity.
