Development of a modular python pipeline for building a single-cell transcriptomic meta-atlas of glial scar formation
Vývoj modulární Python pipeline pro konstrukci transkriptomického meta-atlasu jednotlivých buněk během procesu tvorby gliové jizvy
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/203795Identifiers
Study Information System: 277340
Collections
- Kvalifikační práce [21520]
Author
Advisor
Referee
Tichý, Boris
Faculty / Institute
Faculty of Science
Discipline
Bioinformatics
Department
Department of Genetics and Microbiology
Date of defense
12. 9. 2025
Publisher
Univerzita Karlova, Přírodovědecká fakultaLanguage
English
Grade
Excellent
Keywords (Czech)
Jednobuněčná transkriptomika, bioinformatická pipeline, integrace dat, mozková mrtviceKeywords (English)
Single-cell transcriptomics, bioinformatics pipeline, data integration, strokeIschemická mozková příhoda, způsobená zablokováním přívodu krve do části mozku, patří celosvětově mezi nejčastější příčiny úmrtí. Mozek na takovou událost reaguje izolací postižené oblasti pomocí imunitních buněk, čímž vzniká tzv. gliová jizva. Tato oblast se stává komplexní směsicí různých buněčných typů, kterou je nejvhodnější studovat na úrovni jednotlivých buněk. Vlivem rozšíření single-cell technologií ve vědecké komunitě a nedávných pokroků v oblasti analýzy takovýchto dat je každoročně publikováno stále více single-cell sekvenačních dat, což vytváří příležitost pro jejich reanalýzu a integraci. V této práci reana- lyzuji 17 veřejně dostupných datasetů zaměřených na studium ischemické mozkové příhody u myší metodou jednobuněčné transkriptomiky, spolu s naším, dosud nepublikovaným, datasetem, pomocí modulární pipeline implementované v jazyce Python a propojené pomocí nástroje Nextflow. Tato pipeline provádí anotaci a filtrování na základě kvality, automat- ickou anotaci buněčných typů a vytváří přehledné vizualizace. V této práci dále integruji tato data do jednotného single-cell atlasu a hodnotím různé integrační strategie pomocí moderních metrik, které posuzují jak odstranění technických batch efektů, tak zachování biologického signálu. V neposlední řadě porovnávám výpočetní efektivitu nástrojů...
The ischaemic stroke injury, caused by an obstruction of blood sup- ply to a part of the brain, remains one of the leading causes of death worldwide. The brain's reaction to such an event lies in isolating the affected regions by immune cells, forming a glial scar. The area becomes a complex mix of diverse cell types that is best studied at single-cell resolution. With the widespread adoption of single-cell technology in the scientific community and the recent advancements in data analysis, more and more single-cell sequencing data are published each year, which creates an opportunity for comprehensive data reanalysis and integration. Here, I reanalyse 17 publicly available datasets focusing on single-cell tran- scriptomic data regarding ischaemic stroke injury in mice, as well as our in-house, unpublished dataset, using a modular Python pipeline chained together using the Nextflow framework, which performs quality-control annotation and filtering as well as automatic cell type annotation and produces comprehensive visualisations. Further, I integrate these data into a single-cell atlas and evaluate multiple data integration strategies using state-of-the-art evaluation metrics, focusing both on the removal of technical batch effects and on biological conservation. Last but not least, I compare the tools...
