Optimizing cluster selection in Hierarchical Cluster Analysis
Optimalizace výběru shluků z hierarchické shlukové analýzy
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/203781Identifikátory
SIS: 277237
Kolekce
- Kvalifikační práce [21483]
Autor
Vedoucí práce
Oponent práce
Rozhoňová, Hana
Fakulta / součást
Přírodovědecká fakulta
Obor
Bioinformatika
Katedra / ústav / klinika
Katedra buněčné biologie
Datum obhajoby
12. 9. 2025
Nakladatel
Univerzita Karlova, Přírodovědecká fakultaJazyk
Angličtina
Známka
Velmi dobře
Tato diplomová práce představuje algoritmus pro výběr shluků z dendrogramu hierarchické shlukové analýzy. Navržená metoda pracuje výhradně s dendrogramem ohodnoceným specializovanou funkcí a umožňuje identifikaci smysluplných shluků na základě struktury dendrogramu, bez zpracovávání původních dat. Práce ukazuje, že navržený postup dosahuje dobrých výsledků na cytometrických datasetech zpracovaných pomocí hierarchického algoritmu mhclust, přičemž výsledné shluky vykazují dobrou strukturu v datovém prostoru a zároveň odpovídají expertnímu manuálnímu výběru z dendrogramu. Tato práce tak přispívá k výběru shluků z hierarchické shlukové analýzy, s potenciálem v budoucí automatizaci, především v odvětví cytometrické analýzy.
This thesis introduces an algorithm for extracting non-exhaustive non-overlapping clustering from a given hierarchical clustering tree (dendrogram). The algorithm operates solely on a dendrogram scored using specialized function and is capable of identifying meaningful clusters based on the dendrogram's structure, without requiring access to the underlying data. The thesis demonstrates that the proposed method performs effectively on cytometric datasets clustered using the mhclust hierarchical algorithm, producing results that are both well-structured in the feature space and closely aligned with expert manual selections. As such, this work proposes a novel approach to cluster selection in hierarchical cluster analysis, with potential applications in future automated analyses, particularly in cytometry and related fields.
